Distribuição hipergeométrica

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Em teoria das probabilidades e estatística, a distribuição hipergeométrica é uma distribuição de probabilidade discreta que descreve a probabilidade de se retirar x elementos do tipo A numa sequência de n extrações de uma população finita de tamanho N, com K elementos do tipo A e N-K elementos do tipo B, sem reposição.

Seja um conjunto com N elementos tal que existem K elementos do tipo A e N-K elementos do tipo B. Um conjunto de n elementos é selecionado, aleatoriamente e sem reposição, do conjunto de N elementos. A variável aleatória X denota o número de elementos tipo A. Então, X tem distribuição hipergeométrica e

 P(X=x|N,K,n) = {{{K \choose x} {{N-K} \choose {n-x}}}\over {N \choose n}}

onde x= 0,1,2,...,min(K,n) e onde {a \choose b} refere-se ao coeficiente binomial, o número de combinações possíveis ao seleccionar b elementos de um total a.

O valor esperado da variável aleatória X é dado por

E[X]=n\bigg({K \over N}\bigg)

e a sua variância

Var[X]=\bigg(\frac{N-n}{N-1}\bigg)(n)\bigg(\frac{K}{N}\bigg)\bigg( 1-\frac{K}{N}\bigg).

Quando o tamanho da população é muito maior do que a amostra (isto é, N é muito maior que n) a distribuição hipergeométrica é razoavelmente bem aproximada pela distribuição binomial com parâmetros n (número de tentativas) e p = K / N (probabilidade de sucesso numa tentativa única).


Exemplo[editar | editar código-fonte]

Um jogo de loteria consiste em selecionar seis dezenas do conjunto de cem dezenas de 00 a 99, com uma bola para cada dezena e sem reposição. Num volante (cartão aposta) o jogador pode escolher de 6 a 12 dezenas. Qual é a probabilidade de acertar-se a quina (5 dezenas) marcando-se 10 dezenas no volante?

Temos:

  • N: total de dezenas, N = 100
  • n: total de dezenas sorteadas, n = 6
  • K: total de dezenas escolhidas, K = 10
  • X: total de sucessos, queremos X = 5
 P(X=5|100,10,6) = {{{10 \choose 5} {{100-10} \choose {6-5}}}\over {100 \choose 6}} = {{{252} * {90}}\over {1.192.052.400}} = 0,000019

A probabilidade de se acertar a quina é de aproximadamente 0,0019%.

O interessante é que o mesmo problema pode ser resolvido de outra forma. Podemos pensar que a escolha aleatória é feita pelo jogador, e que as dezenas "premiadas" já estão definidas a priori (sem o jogador saber, é claro). Isto é, existem 2 tipos de dezenas, as "premiadas" e as "não premiadas", e o jogador escolhe aleatoriamente (ou não, desde que o seu critério de escolha seja independente das dezenas "premiadas") as 10 dezenas do seu jogo. Assim

  • N: total de dezenas, N = 100
  • n: total de dezenas sorteadas/escolhidas pelo jogador), n = 10
  • K: total de dezenas premiadas, K = 6
  • X: total de sucessos, queremos X = 5
 P(X=5|100,6,10) = {{{6 \choose 5} {{100-6} \choose {10-5}}}\over {100 \choose 10}} = {{{6} * {54.891.018}}\over {17.310.309.456.440}} = 0,000019

O resultado é o mesmo!

Ligações externas[editar | editar código-fonte]