Processo de Pitman–Yor

Origem: Wikipédia, a enciclopédia livre.
Saltar para a navegação Saltar para a pesquisa

Em teoria das probabilidades, um processo de Pitman–Yor, denotado , é um processo estocástico cujo caminho amostral é uma distribuição de probabilidade. Uma amostra aleatória a partir deste processo é uma distribuição de probabilidade discreta infinita, que consiste em um conjunto infinito de átomos retirados de , com pesos retirados de uma distribuição de Poisson–Dirichlet de dois parâmetros. O processo recebe este nome em homenagem aos matemáticos Jim Pitman e Marc Yor.[1][2]

Os parâmetros que governam o processo de Pitman–Yor são: um parâmetro de desconto , um parâmetro de força e uma distribuição de base sobre o espaço de probabilidade . Quando , torna-se o processo de Dirichlet. O parâmetro de desconto dá ao processo de Pitman–Yor mais flexibilidade sobre o comportamento de cauda quando comparado ao processo de Dirichlet, que tem caudas exponenciais. Isto torna o processo de Pitman–Yor útil para a modelagem de dados com caudas de lei de potência (por exemplo, frequências de palavras em linguagem natural).[3]

A partição aleatória intercambiável induzida pelo processo de Pitman–Yor é um exemplo de uma partição de Poisson–Kingman e de uma partição aleatória de Gibbs.[4]

Convenções nominais[editar | editar código-fonte]

O nome "processo de Pitman–Yor" foi cunhado por Hemant Ishwaran e Lancelot James depois da revisão de Pitman e Yor sobre o assunto.[5][2] Entretanto, o processo foi originalmente estudado por Mihael Perman et al.[6][7]

Também é algumas vezes referido como o processo de Poisson–Dirichlet de dois parâmetros, depois da generalização de dois parâmetros da distribuição de Poisson–Dirichlet que descreve a distribuição conjunta dos tamanhos dos átomos na medida aleatória, separados por ordem estritamente decrescente.

Ver também[editar | editar código-fonte]

Referências

  1. Ishwaran, Hemant; James, Lancelot F. (2003). «GENERALIZED WEIGHTED CHINESE RESTAURANT PROCESSES FOR SPECIES SAMPLING MIXTURE MODELS». Statistica Sinica. 13 (4): 1211–1235 
  2. a b Pitman, Jim; Yor, Marc (1997). «The two-parameter Poisson-Dirichlet distribution derived from a stable subordinator». The Annals of Probability. 25 (2): 855–900. ISSN 0091-1798. doi:10.1214/aop/1024404422 
  3. Pitman, Jim (11 de maio de 2006). Combinatorial Stochastic Processes: Ecole d'Eté de Probabilités de Saint-Flour XXXII - 2002 (em inglês). [S.l.]: Springer Science & Business Media. ISBN 9783540309901 
  4. Teh, Yee Whye (17 de julho de 2006). «A hierarchical Bayesian language model based on Pitman-Yor processes». Association for Computational Linguistics. Proceedings of the 21st International Conference on Computational Linguistics and the 44th annual meeting of the ACL - ACL '06: 985–992. doi:10.3115/1220175.1220299 
  5. Ishwaran, Hemant; James, Lancelot (2001). «Gibbs Sampling Methods for Stick-Breaking Priors». Journal of the American Statistical Association. 96 (453). Consultado em 18 de janeiro de 2018. 
  6. Perman, Mihael; Pitman, Jim; Yor, Marc (1 de março de 1992). «Size-biased sampling of Poisson point processes and excursions». Probability Theory and Related Fields (em inglês). 92 (1): 21–39. ISSN 0178-8051. doi:10.1007/BF01205234 
  7. Perman, Mihael (1990). Random discrete distributions derived from subordinatores. Berkeley, Estados Unidos: Departamento de Estatística, Universidade da Califórnia em Berkeley