Função densidade

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Em estatística, a função densidade de probabilidade ou simplesmente função de densidade é uma função não negativa utilizada para representar a distribuição de probabilidade caso a variável aleatória seja contínua. Utiliza-se para esses efeitos a integral.

Se uma variável aleatória tem densidade dada por f(x), então o intervalo infinitesimal [x, x+dx] tem probabilidade f(x) dx. Formalmente, a função densidade de probabilidade (ou fdp), denotada por F_X(x), de uma variável aleatória contínua X é a função que satisfaz

Em linguagem matemática Em Português
F_X(x)=P\left [ a \le X \le b \right ] =  \int_{a}^b \,f(x)\,dx Uma variável aleatória contínua tem densidade f(x) se f é uma função não-negativa integrável à Lebesgue tal que a probabilidade no intervalo [a,b] é dada por \int_{a}^b \,f(x)\,dx
F_X(x)=P\left [X \le x \right ] = {\color{Red}\int_{-\infty}^{x} f(X)\, dX} 1 A probabilidade de a variável aleatória X assumir um valor menor ou igual a um certo x é dada pela integral {\color{Red}\int_{-\infty}^{x} f(X)\, dX} . Equivale, quando à função distribuição acumulada das variáveis aleatórias discretas.

Diferença entre "função de probabilidade" e "função densidade de probabilidade"[editar | editar código-fonte]

O conceito de "função densidade de probabilidade" é muito semelhante ao conceito de "função de probabilidade", que serve para o caso de variáveis aleatórias discretas. No entanto, é preciso entender bem a diferença entre eles.

Uma variável aleatória discreta tem um número definido de possíveis ocorrências. Por exemplo, a variável aleatória "resultado de um dado" tem apenas 6 possíveis ocorrências: 1,2,3,4,5 e 6. Por isso, a função de probabilidade a ela associada também só pode assumir 6 valores (1/6 cada uma, se o dado não for viciado), que necessariamente somarão 1.

Uma variável aleatória contínua, ao contrário, tem um número infinito de ocorrências. Por exemplo, a variável aleatória "idade de cada empregado de uma empresa" pode assumir infinitos valores, por exemplo 18,1 anos, 18,23 anos, 20,341 anos, 30,3167 anos etc. Por isso, se simplesmente tentarmos calcular P \left ( X=x \right ) como faz uma função de probabilidade para uma variável aleatória discreta, chegaremos ao seguinte2 :

P \left ( X=x \right )\le P \left ( x- \epsilon < X \le x \right ) = {\color{OliveGreen}P \left ( X \le x \right ) - P \left ( X \le x-\epsilon \right )},\forall \epsilon >0

Portanto,

0 \le P \left ( X=x \right ) \le \lim_{\epsilon \to 0}\left [{\color{OliveGreen}P \left ( X \le x \right ) - P \left ( X \le x-\epsilon \right )}\right ] =0

Ou seja, a probabilidade de a variável aleatória contínua X assumir um determinado valor x é zero. Por isso, a "função densidade de probabilidade" não trabalha com valores pontuais, e sim com intervalos infinitesimais - ela informa a probabilidade de a variável X assumir um valor naquele intervalo.

Funções distribuição de probabilidade[editar | editar código-fonte]

Se uma variável aleatória X: \Omega \to \mathbb{R} definida no espaço probabilidade (\Omega , P) é dada, podemos fazer questões como "Qual a probabilidade de que o valor de X é maior do que 2?". Isto é o mesmo que a probabilidade do evento \{ \omega \in\Omega : X(\omega) > 2 \} que normalmente se escreve como P(X > 2) por abreviação.

Registrando todas estas probabilidades de amplitudes totais da variável aleatória real X gera a distribuição de probabilidade de X. A distribuição de probabilidade "esquece" o espaço probabilidade particular usado para definir X e regista apenas as probabilidades de vários valores de X. Tal distribuição de probabilidade pode ser sempre capturada pela sua função distribuição acumulada

F_X(x) = \operatorname{P}(X \le x)

e por vezes também usando a função densidade da probabilidade. Em termos da teoria da medida, nós usamos a variável aleatória X para "transpor" a medida P de Ω para uma medida dF em R. O espaço probabilidade subjacente Ω é um instrumento técnico usado para garantir a existência de variáveis aleatórias, e por vezes para as construir. Na prática, usa-se geralmente o espaço Ω e apenas se coloca uma medida em R que consigna a medida 1 para o todo a linha real, i.e. trabalha-se com distribuições de probabilidade em vez de variáveis aleatórias.

Propriedades[editar | editar código-fonte]

quaisquer que sejam a e b, a probabilidade de todo o espaço amostral é 1:

 \int_{-\infty}^\infty \,f(x)\,dx=1

Função densidade de probabilidade conjunta[editar | editar código-fonte]

Uma função f \left ( x,y \right ) de \mathbb{R}^r em \mathbb{R}^r é uma função densidade de probabilidade conjunta, ou fdp conjunta do vetor aleatório bivariado contínuo (X,Y) se, para cada conjunto A \sub \mathbb{R}^r,

P \left [ \left (X,Y \right ) \in A \right ] = \iint\limits_A f \left ( x,y \right )dxdy

Uma fdp conjunta é utilizada exatamente como uma univariada, exceto que agora as integrais são duplas nos conjuntos do plano3 .

Referências

  1. Teoria da probabilidade. Disponível em: <http://www2.dbd.puc-rio.br/pergamum/tesesabertas/0210463_06_cap_04.pdf>. Página 2. Acesso em: 22 de fevereiro de 2011.
  2. CASELLA, George, e BERGER, Roger L. Inferência estatística - tradução da 2ª edição norte-americana. Centage Learning, 2010 ISBN13: 9788522108947, ISBN10: 8522108943. Página 33.
  3. CASELLA, George, e BERGER, Roger L. Inferência estatística - tradução da 2ª edição norte-americana. Centage Learning, 2010 ISBN13: 9788522108947, ISBN10: 8522108943. Página 130
Ícone de esboço Este artigo sobre matemática é um esboço. Você pode ajudar a Wikipédia expandindo-o.