Coeficiente de correlação de Pearson

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
Question book.svg
Esta página ou secção não cita nenhuma fonte ou referência, o que compromete sua credibilidade (desde Agosto de 2011).
Por favor, melhore este artigo providenciando fontes fiáveis e independentes, inserindo-as no corpo do texto por meio de notas de rodapé. Encontre fontes: Googlenotícias, livros, acadêmicoYahoo!Bing. Veja como referenciar e citar as fontes.

Em estatística descritiva, o coeficiente de correlação de Pearson, também chamado de "coeficiente de correlação produto-momento" ou simplesmente de "\rho de Pearson" mede o grau da correlação (e a direcção dessa correlação - se positiva ou negativa) entre duas variáveis de escala métrica (intervalar ou de rácio/razão).

Este coeficiente, normalmente representado por \rho assume apenas valores entre -1 e 1.

  • \rho= 1 Significa uma correlação perfeita positiva entre as duas variáveis.
  • \rho= -1 Significa uma correlação negativa perfeita entre as duas variáveis - Isto é, se uma aumenta, a outra sempre diminui.
  • \rho= 0 Significa que as duas variáveis não dependem linearmente uma da outra. No entanto, pode existir uma dependência não linear. Assim, o resultado \rho=0 deve ser investigado por outros meios.

Cálculo[editar | editar código-fonte]

Calcula-se o coeficiente de correlação de Pearson segundo a seguinte fórmula:


\rho = \frac{\sum_{i=1}^{n}(x_i-\bar{x})(y_i-\bar{y})}{\sqrt{\sum_{i=1}^{n}(x_i-\bar{x})^2}\cdot\sqrt{\sum_{i=1}^{n}(y_i-\bar{y})^2}}
= \frac{\operatorname{cov}(X, Y)}{\sqrt{\operatorname{var}(X)\cdot\operatorname{var}(Y)}}

onde x_1, x_2, \dots, x_n e y_1, y_2, \dots, y_n são os valores medidos de ambas as variáveis. Para além disso


\bar{x} = \frac{1}{n}\cdot\sum_{i=1}^{n} x_{i}

e


\bar{y} = \frac{1}{n}\cdot\sum_{i=1}^{n} y_{i}
são as médias aritméticas de ambas as variáveis.

A análise correlacional indica a relação entre 2 variaveis lineares e os valores sempre serão entre +1 e -1. O sinal indica a direção, se a correlação é positiva ou negativa, e o tamanho da variavel indica a força da correlação.

Interpretando \rho[editar | editar código-fonte]

  • 0.70 para mais ou para menos indica uma forte correlação.
  • 0.30 a 0.7 positivo ou negativo indica correlação moderada.
  • 0 a 0.30 Fraca correlação.

Interpretação geométrica[editar | editar código-fonte]

As duas séries de valores X (x_1, \ldots, x_n) e Y (y_1, \ldots, y_n) podem ser consideradas como vetores em um espaço de n dimensões. X (x_1 - \bar x, \ldots, x_n - \bar x) e Y (y_1 - \bar y, \ldots, y_n - \bar y).

O cosseno do ângulo α entre estes vetores é dado pela fórmula (produto escalar normado):


\cos(\alpha) = \dfrac{\displaystyle \sum_{i=1}^N (x_i - \bar x)\cdot(y_i - \bar y)}{\sqrt{\displaystyle \sum_{i=1}^N (x_i - \bar x)^2}\cdot\sqrt{\displaystyle \sum_{i=1}^N (y_i - \bar y)^2}}

Portanto \cos(\alpha) = \rho

O coeficiente de correlação não é outro senão o cosseno do ângulo α entre os dois vetores!

Se \rho = 1, o ângulo α = 0, os dois vetores são colineares (paralelos).
Se \rho = 0, o ângulo α = 90°, os dois vetores são ortogonais.
Se \rho = -1, o ângulo α = 180°, os dois vetores são colineares com sentidos opostos.
Mais geralmente : \alpha = \arccos(\rho), (\arccos é a inversa da função cosseno).

Ver também[editar | editar código-fonte]