Distribuição de Dirichlet

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Na probabilidade e estatística, a Distribuição de Dirichlet (nome em homenagem à Johann Peter Gustav Lejeune Dirichlet), frequentemente representada por Dir(α), é uma distribuição discreta multivaridada com um parâmetro (vetorial) α não-negativo e real.

Em análises Bayesianas, a distribuição de Dirichlet é usada como a distribuição conjugada da distribuição multinomial, ou seja, se a distribuição a priori é uma distribuição de Dirichlet e a variável observada é uma multinominal, então a distribuição a posteriori será uma distribuição de Dirichlet (com outro parâmetro).

Função de densidade das probabilidades[editar | editar código-fonte]

A função de densidade das probabilidades da distribuição de Dirichlet de ordem K são as seguintes:

f(x_1, \dots, x_K; \alpha_1, \dots, \alpha_K) = \frac{1}{\mathrm{B}(\alpha)} \prod_{i=1}^K x_i^{\alpha_i - 1}

Onde x_i \ge 0\,, \sum_{i=1}^K x_i = 1\,, e \alpha_i > 0\,.

A normalização constante é a multinomial função beta, que podem serexpressos nos termos da função gama:

\mathrm{B}(\alpha) = \frac{\prod_{i=1}^K \Gamma(\alpha_i)}{\Gamma\left(\sum_{i=1}^K \alpha_i\right)}.

Propriedades[editar | editar código-fonte]

se X = (X_1, \ldots, X_K)\sim\operatorname{Dir}(\alpha) e \alpha_0 = \sum_{i=1}^K\alpha_i. então:

 \mathrm{E}[X_i|\alpha] = \frac{\alpha_i}{\alpha_0},
\mathrm{Var}[X_i|\alpha] = \frac{\alpha_i (\alpha_0-\alpha_i)}{\alpha_0^2 (\alpha_0+1)} = \frac{\mathrm{E}[X_i|\alpha] (1-\mathrm{E}[X_i|\alpha])}{(\alpha_0+1)}.

De fato, essa é uma das propriedades da distribuição beta:

X_i \sim \operatorname{Beta}(\alpha_i, \alpha_0 - \alpha_i).

Além disso:

\mathrm{Cov}[X_iX_j|\alpha] = \frac{- \alpha_i \alpha_j}{\alpha_0^2 (\alpha_0+1)}.

A maneira de distribuição resulta em um vetor (x1, ..., xK) com:

 x_i = \frac{\alpha_i - 1}{\alpha_0 - K}, \quad \alpha_i > 1.

A distribuição de Dirichlet é conjugada como uma distribuição multinomial com a seguinte lógica: se

\beta|X=(\beta_1, \ldots, \beta_{K})|X \sim \operatorname{Mult}(X),

Onde βi São ocorrências dos números i na amostra de n Pontos na discreta distribuição de {1, ..., K} definida por X, então:

X | \beta \sim \operatorname{Dir}(\alpha + \beta).

A relação usada nas estatísticas Bayesiana para descobrir o valor das incógnitas, X, de uma distribuição oculta de probrabilidades, dada por n amostras. Intuitivamente, a distribuição prior representada como Dir(α), sendo Dir(α + β) resulta em uma distribuição posterior observadas com o historiograma β.

Neutralidade[editar | editar código-fonte]

(ver artigo principal: Vetor Neutro).

se X = (X_1, \ldots, X_K)\sim\operatorname{Dir}(\alpha), então o vetor ~X será neutro[1] se o sentido de X_1 for independente de X_2/(1-X_1),X_3/(1-X_1),\ldots,X_K/(1-X_1) e similar à X_2,\ldots,X_{K-1}.

Ver também[editar | editar código-fonte]

Notas[editar | editar código-fonte]

  1. Disformização variável,por Luc Devroye

Referências

  1. R. J. Connor and J. E. Mosiman 1969. Concepts of independence for proportions with a generalization of the Dirichlet distibution. Journal of the American Statistical Association, volume 64, pp194--206

Ligações externas[editar | editar código-fonte]

Ícone de esboço Este artigo sobre matemática é um esboço. Você pode ajudar a Wikipédia expandindo-o.