O coeficiente de determinação, também chamado de R², é uma medida de ajuste de um modelo estatístico linear generalizado, como a regressão linear simples ou múltipla, aos valores observados de uma variável aleatória. O R² varia entre 0 e 1, por vezes sendo expresso em termos percentuais. Nesse caso, expressa a quantidade da variância dos dados que é explicada pelo modelo linear. Assim, quanto maior o R², mais explicativo é o modelo linear, ou seja, melhor ele se ajusta à amostra. Por exemplo, um R² = 0,8234 significa que o modelo linear explica 82,34% da variância da variável dependente a partir do regressores (variáveis independentes) incluídas naquele modelo linear.

onde

é o numero de observações;
Partindo de que
é o valor observado e
é a média das observações, esta equação dá-nos a Soma Total dos Quadrados, ou seja, a soma dos quadrados das diferenças entre a média e cada valor observado.

onde

é o valor estimado (previsão) de

.
Esta equação é a soma dos quadrados dos resíduos, que calcula a parte que não é explicada pelo modelo.

onde
é o valor estimado (previsão) de
.
Esta equação, a soma dos quadrados explicada, indica-nos a diferença entre a média das observações e o valor estimado para cada observação, e soma os respectivos quadrados. Quanto menor for a diferença, maior poder explicativo detém o modelo.
Em alguns casos temos:

E normalizando a equação de cima, temos que:

A inclusão de inúmeras variáveis, mesmo que tenham muito pouco poder explicativo sobre a variável dependente, aumentarão o valor de R². Isto incentiva a inclusão indiscriminada de variáveis, prejudicando o princípio da parcimônia (ver de forma mais ampla em navalha de Ockhan). Para combater esta tendência, podemos usar uma medida alternativa do coeficiente de determinação, que penaliza a inclusão de regressores pouco explicativos. Trata-se do R² ajustado:

onde

representa o número de variáveis explicativas mais a constante.
Note que a inclusão de mais variáveis com pouco poder explicativo prejudica o valor do R² ajustado, porque aumenta
uma unidade, sem aumentar substancialmente o
.
Relação entre Coeficiente de Determinação (R²) e Coeficiente de Correlação (R)[editar | editar código-fonte]
Para provarmos que o Coeficiente de Determinação equivale ao quadrado do Coeficiente de Correlação, precisamos provar inicialmente:
Teorema 1:
[editar | editar código-fonte]
Prova:
[editar | editar código-fonte]
Teorema 2:
[editar | editar código-fonte]
Prova: Inicialmente, precisamos reescrever a expressão do valor estimado pela Regressão Linear:
![{\displaystyle =[A.(x_{1}-{\overline {x}})+({\overline {y}}-y_{1})]^{2}+\cdots +[A.(x_{n}-{\overline {x}})+({\overline {y}}-y_{n})]^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6055281ac885c4e6e940a3cdd26a3078a83e0c5d)


Teorema 3:
Prova:
Teorema 4: (Coeficiente de Correlação)² = Coeficiente de Determinação
Prova: Coeficiente de Correlação =
Para elevá-lo ao quadrado, façamos separadamente numerador e denominador:
Quadrado do numerador:
Agora, façamos o quadrado do denominador:
Juntando, temos:
(Coeficiente de Correlação)² =
= Coeficiente de Determinação (R²) c.q.d.