Distribuição hipergeométrica

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Em teoria das probabilidades e estatística, a distribuição hipergeométrica é uma distribuição de probabilidade discreta que descreve a probabilidade de se retirar x elementos do tipo A numa sequência de n extrações de uma população finita de tamanho N, com K elementos do tipo A e N-K elementos do tipo B, sem reposição.

Seja um conjunto com N elementos tal que existem K elementos do tipo A e N-K elementos do tipo B. Um conjunto de n elementos é selecionado, aleatoriamente e sem reposição, do conjunto de N elementos. A variável aleatória X denota o número de elementos tipo A. Então, X tem distribuição hipergeométrica e

onde x= 0,1,2,...,min(K,n) e onde refere-se ao coeficiente binomial, o número de combinações possíveis ao seleccionar elementos de um total .

O valor esperado da variável aleatória X é dado por

e a sua variância

.

Quando o tamanho da população é muito maior do que a amostra (isto é, N é muito maior que n) a distribuição hipergeométrica é razoavelmente bem aproximada pela distribuição binomial com parâmetros n (número de tentativas) e p = K / N (probabilidade de sucesso numa tentativa única).


Exemplo[editar | editar código-fonte]

Um jogo de loteria consiste em selecionar seis números do conjunto de cem números de 00 a 99, com uma bola para cada número e sem reposição. Num volante (cartão aposta) o jogador pode escolher de 6 a 12 números. Qual é a probabilidade de acertar-se a quina (5 números) marcando-se 10 números no volante?

Temos:

  • N: total de números, N = 100
  • n: total de números sorteados, n = 6
  • K: total de números escolhidos, K = 10
  • X: total de sucessos, queremos X = 5

A probabilidade de se acertar a quina é de aproximadamente 0,0019%.

O interessante é que o mesmo problema pode ser resolvido de outra forma. Podemos pensar que a escolha aleatória é feita pelo jogador, e que os números "premiados" já estão definidos a priori (sem o jogador saber, é claro). Isto é, existem 2 tipos de números, os "premiados" e as "não premiados", e o jogador escolhe aleatoriamente (ou não, desde que o seu critério de escolha seja independente dos números "premiados") os 10 números do seu jogo. Assim:

  • N: total de números, N = 100
  • n: total de números sorteados/escolhidos pelo jogador), n = 10
  • K: total de números premiados, K = 6
  • X: total de sucessos, queremos X = 5

O resultado é o mesmo!

Ligações externas[editar | editar código-fonte]