Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

O coeficiente de determinação, também chamado de , é uma medida de ajustamento de um modelo estatístico linear generalizado, como a Regressão linear, em relação aos valores observados. O R² varia entre 0 e 1, indicando, em percentagem, o quanto o modelo consegue explicar os valores observados. Quanto maior o R², mais explicativo é modelo, melhor ele se ajusta à amostra.

Por exemplo, se o R² de um modelo é 0,8234, isto significa que 82,34% da variável dependente consegue ser explicada pelos regressores presentes no modelo.

Método[editar | editar código-fonte]

SQ_\text{tot}=\sum_{i=1}^n (y_i-\bar{y})^2\,

, onde n é o numero de observações;

Partindo de y_i é o valor observado e \bar{y} é a média das observações, esta equação dá-nos a Soma Total dos Quadrados, ou seja, a soma dos quadrados das diferenças entre a média e cada valor observado.


SQ_\text{exp}=\sum_{i=1}^n (\hat{y_i} -\bar{y})^2\,

, onde \hat{y_i} é o valor estimado (previsão) de y_i

Esta equação, a Soma dos Quadrados Explicada, indica-nos a diferença entre a média das observações e o valor estimado para cada observação, e soma os respectivos quadrados. Quanto menor for a diferença, maior poder explicativo detém o modelo.


SQ_\text{res}=\sum_{i=1}^n (\hat{y_i} - y_i)^2\,

Esta equação é a Soma dos Quadrados dos Resíduos, que calcula a parte que não é explicada pelo modelo.


Sabemos que:

SQ_\text{tot}=SQ_\text{exp}+SQ_\text{res}\,,

E normalizando a equação de cima, temos que:

R^2=\frac{SQ_\text{exp}}{SQ_\text{tot}}=1-\frac{SQ_\text{res}}{SQ_\text{tot}}

R² ajustado[editar | editar código-fonte]

A inclusão de inúmeras variáveis, mesmo que tenham muito pouco poder explicativo sobre a variável dependente, aumentarão o valor de . Isto incentiva a inclusão indiscriminada de variáveis, prejudicando o princípio da parcimónia. Para combater esta tendência, podemos usar uma medida alternativa do coeficiente de determinação, que penaliza a inclusão de regressores pouco explicativos. Trata-se do R² ajustado:

\bar{R^2}=1-\frac{n-1}{n-(k+1)}\left(1-R^2\right)\,\!

, onde (k+1)\,\! representa o número de variáveis explicativas mais a constante.

Note que a inclusão de mais variáveis com pouco poder explicativo prejudica o valor do R² ajustado, porque aumenta k uma unidade, sem aumentar substancialmente o R^2.