Desvio padrão

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
Question book.svg
Esta página ou secção não cita fontes confiáveis e independentes, o que compromete sua credibilidade (desde setembro de 2011). Por favor, adicione referências e insira-as corretamente no texto ou no rodapé. Conteúdo sem fontes poderá ser removido.
Encontre fontes: Google (notícias, livros e acadêmico)

Em Probabilidade e Estatística, o desvio padrão é a medida mais comum da dispersão estatística (representado pelo símbolo sigma, σ). Ele mostra o quanto de variação ou "dispersão" existe em relação à média (ou valor esperado). Um baixo desvio padrão indica que os dados tendem a estar próximos da média; um desvio padrão alto indica que os dados estão espalhados por uma gama de valores.

O desvio padrão define-se como a raiz quadrada da variância. É definido desta forma de maneira a dar-nos uma medida da dispersão que:

  1. Seja um número não-negativo;
  2. Use a mesma unidade de medida dos dados fornecidos inicialmente.

Faz-se uma distinção entre o desvio padrão σ (sigma) do total de uma população ou de uma variável aleatória, e o desvio padrão de um subconjunto em amostra.

O termo desvio padrão foi introduzido na estatística por Karl Pearson no seu livro de 1894: "Sobre a dissecção de curvas de frequência assimétricas".

Definição e cálculo de desvio padrão[editar | editar código-fonte]

Desvio padrão de uma variável aleatória[editar | editar código-fonte]

O desvio padrão de uma variável aleatória X é definido como:

Em outras palavras, o desvio padrão amostral de uma variável aleatória X pode ser calculado como: Para cada valor calcula-se a diferença entre e o valor médio

.

Calcula-se o quadrado dessa diferença. No caso dos dados estarem tabelados (com frequências), multiplica-se cada um destes quadrados pela respectiva frequência, ou seja, a soma é a dos produtos dos quadrados das diferenças pela respectiva frequência. Encontra-se a soma dos quadrados das diferenças.

Divide-se este resultado por: (número de valores), ou seja, . Esta quantidade é a variância . Tome a raiz quadrática deste resultado. O desvio padrão também pode ser calculado quando não se sabe a média dos dados. O cálculo é feito conforme a fórmula:

onde é o valor esperado de X.

Nem todas as variáveis aleatórias possuem desvio padrão, porque esses valores esperados não precisam existir. Por exemplo, o desvio padrão de uma variável que flui em uma distribuição de Cauchy é indefinido.

Desvio padrão amostral[editar | editar código-fonte]

Se uma variável aleatória toma os valores então o desvio padrão para esta amostra de números (ou desvio padrão amostral) pode ser calculado da seguinte forma. Primeiro calcula-se a média de através de:

(Veja notação sigma). Depois, o desvio padrão amostral é calculado como:

A divisão por aparece quando exigimos que a variância amostral seja um estimador não tendencioso da variância populacional

Quando os dados estão agrupados(frequência) temos:

onde é o número de observações diferentes.

Em outras palavras, o desvio padrão amostral de uma variável aleatória X pode ser calculada como:

  1. Para cada valor calcula-se a diferença entre e o valor médio .
  2. Calcula-se o quadrado dessa diferença. No caso dos dados estarem tabelados (com frequências), multiplica-se cada um destes quadrados pela respectiva frequência.
  3. Encontra-se a soma dos quadrados das diferenças. No caso dos dados estarem tabelados (com frequências), a soma é a dos produtos dos quadrados das diferenças pela respectiva frequência.
  4. Divide-se este resultado por: (número de valores - 1), ou seja, Esta quantidade é a variância
  5. Tome a raiz quadrática deste resultado.

O desvio padrão também pode ser calculado quando não se sabe a média dos dados. O cálculo é feito conforme a fórmula:

Propriedades[editar | editar código-fonte]

A distribuição normal.

De uma distribuição normal unimodal, gaussiana, simétrica, de afunilamento médio (ou mesocúrtica) podemos dizer o seguinte:

  • 68% dos valores encontram-se a uma distância da média inferior a um desvio padrão.
  • 95% dos valores encontram-se a uma distância da média inferior a duas vezes o desvio padrão.
  • 99,7% dos valores encontram-se a uma distância da média inferior a três vezes o desvio padrão.

Esta informação é conhecida como a regra dos "68-95-99,7".

Ver também[editar | editar código-fonte]