Desvio padrão

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
Question book.svg
Esta página ou secção não cita nenhuma fonte ou referência, o que compromete sua credibilidade (desde setembro de 2011).
Por favor, melhore este artigo providenciando fontes fiáveis e independentes, inserindo-as no corpo do texto por meio de notas de rodapé. Encontre fontes: Googlenotícias, livros, acadêmicoScirusBing. Veja como referenciar e citar as fontes.

Em Probabilidade e Estatística, o desvio padrão é a medida mais comum da dispersão estatística (representado pelo símbolo sigma, σ). Ele mostra o quanto de variação ou "dispersão" existe em relação à média (ou valor esperado). Um baixo desvio padrão indica que os dados tendem a estar próximos da média; um desvio padrão alto indica que os dados estão espalhados por uma gama de valores.

O desvio padrão define-se como a raiz quadrada da variância. É definido desta forma de maneira a dar-nos uma medida da dispersão que:

  1. seja um número não-negativo;
  2. use a mesma unidade de medida dos dados fornecidos inicialmente.

Faz-se uma distinção entre o desvio padrão σ (sigma) do total de uma população ou de uma variável aleatória, e o desvio padrão de um subconjunto em amostra.

O termo desvio padrão foi introduzido na estatística por Karl Pearson no seu livro de 1894: "Sobre a dissecção de curvas de frequência assimétricas".

Definição e cálculo de desvio padrão[editar | editar código-fonte]

Desvio padrão de uma variável aleatória[editar | editar código-fonte]

O desvio padrão de uma variável aleatória X é definido como:

\operatorname{\sigma} = \sqrt{\operatorname{\sum}((X-\operatorname{\sum}(X))^2)} = \sqrt{\operatorname{\sum}(X^2) - (\operatorname{\sum}(X))^2}

Em outras palavras, o desvio padrão amostral de uma variável aleatória X pode ser calculado como: Para cada valor x_i calcula-se a diferença entre x_i e o valor médio \overline{x}

x_i - \overline{x} .

Calcula-se o quadrado dessa diferença. No caso dos dados estarem tabelados (com frequências), multiplica-se cada um destes quadrados pela respectiva frequência, ou seja, a soma é a dos produtos dos quadrados das diferenças pela respectiva frequência. Encontra-se a soma dos quadrados das diferenças.

Divide-se este resultado por: (número de valores - 1), ou seja, n-1. Esta quantidade é a variância s^2. Tome a raiz quadrática deste resultado. O desvio padrão também pode ser calculado quando não se sabe a média dos dados. O cálculo é feito conforme a fórmula: s = \sqrt{\frac{\sum x_i^{2} - \frac{1}{n} (\sum x_i)^{2}}{n-1}}

onde \operatorname{\sum}(X) é o valor esperado de X.

Nem todas as variáveis aleatórias possuem desvio padrão, porque esses valores esperados não precisam existir. Por exemplo, o desvio padrão de uma variável que flui em uma distribuição de Cauchy é indefinido.

Desvio padrão amostral[editar | editar código-fonte]

Se uma variável aleatória \operatorname{X} toma os valores  \operatorname{x}_1,\dots,\operatorname{x}_n , então o desvio padrão para esta amostra de n números (ou desvio padrão amostral) pode ser calculado da seguinte forma. Primeiro calcula-se a média de  \operatorname{X}, \overline{x}, através de:

\overline{x} = \dfrac{1}{n}\sum_{i=1}^n x_i = \dfrac{x_1+x_2+\cdots+x_n}{n}

(veja notação sigma). Depois, o desvio padrão amostral é calculado como:

s = \sqrt{\dfrac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2}

A divisão por n-1 aparece quando exigimos que a variância amostral \operatorname{s}^2 seja um estimador não tendencioso da variância populacional \operatorname{\sigma}^2.

Quando os dados estão agrupados(frequência) temos:

s = \sqrt{\dfrac{1}{(\sum_{i=1}^k {f_i})-1} \sum_{i=1}^k ((x_i - \overline{x})^2 \times f_i)}

onde k é o número de observações diferentes.

Em outras palavras, o desvio padrão amostral de uma variável aleatória X pode ser calculada como:

  1. Para cada valor  x_i calcula-se a diferença x_i - \overline{x} entre  x_i e o valor médio \overline{x}.
  2. Calcula-se o quadrado dessa diferença. No caso dos dados estarem tabelados (com frequências), multiplica-se cada um destes quadrados pela respectiva frequência.
  3. Encontra-se a soma dos quadrados das diferenças. No caso dos dados estarem tabelados (com frequências), a soma é a dos produtos dos quadrados das diferenças pela respectiva frequência.
  4. Divide-se este resultado por: (número de valores - 1), ou seja,  (n-1). Esta quantidade é a variância  s^2 .
  5. Tome a raiz quadrática deste resultado.

O desvio padrão também pode ser calculado quando não se sabe a média dos dados. O cálculo é feito conforme a fórmula:

s = \sqrt{\frac{\sum x_i^{2} - \frac{1}{n} (\sum x_i)^{2}}{n-1}}

Propriedades[editar | editar código-fonte]

A distribuição normal.

De uma distribuição normal unimodal, gaussiana, simétrica, de afunilamento médio (ou mesocúrtica) podemos dizer o seguinte:

  • 68% dos valores encontram-se a uma distância da média inferior a um desvio padrão.
  • 95% dos valores encontram-se a uma distância da média inferior a duas vezes o desvio padrão.
  • 99,7% dos valores encontram-se a uma distância da média inferior a três vezes o desvio padrão.

Esta informação é conhecida como a regra dos "68-95-99,7".

Ver também[editar | editar código-fonte]

Ligações externas[editar | editar código-fonte]