Fração de variância inexplicada
Em estatística, a fração de variância inexplicada (FVI) no contexto de uma tarefa de regressão é a fração de variância do regressando (variável dependente) Y que não pode ser explicada, ou seja, que não é corretamente predita, pelas variáveis explicativas X.
Definição formal
[editar | editar código-fonte]Suponha que nos seja dada uma função de regressão rendendo para cada uma estimativa onde é o vetor das i-ésimas observações sobre todas as variáveis explicativas.[1]:181 Definimos a fração de variância inexplicada (FVI) como:
onde R2 é o coeficiente de determinação e VARerr e VARtot são a variância dos resíduos e a variância amostral da variável dependente. SSerr (a soma dos erros quadráticos das previsões, equivalentemente a soma residual dos quadrados), SStot (a soma total dos quadrados), e SSreg (a soma dos quadrados da regressão, equivalentemente a soma explicada dos quadrados) são dados por
Alternativamente, a fração de variância inexplicada pode ser definida da seguinte forma:
onde é o erro quadrático médio da função de regressão .
Explicação
[editar | editar código-fonte]É útil considerar a segunda definição para entender FVI. Ao tentar prever Y, a função de regressão mais ingênua que podemos pensar é a função constante que prevê a média de Y, ou seja, . Segue-se que o MSE desta função é igual à variância de Y; ou seja, SSerr = SStot, e SSreg = 0. Nesse caso, nenhuma variação em Y pode ser contabilizada e a FVI tem então seu valor máximo de 1.
Mais geralmente, o FVI será 1 se as variáveis explicativas X não nos dizem nada sobre Y no sentido de que os valores previstos de Y não variam com Y. Mas à medida que a previsão melhora e o MSE pode ser reduzido, o FVI diminui. No caso de previsão perfeita onde para todo i, o MSE é 0, SSerr = 0, SSreg = SStot, e o FVI é 0.
Referências
- ↑ Achen, C. H. (1990). «'What Does "Explained Variance" Explain?: Reply». Political Analysis. 2 (1): 173–184. doi:10.1093/pan/2.1.173