Ponto de alavanca (estatística)

Origem: Wikipédia, a enciclopédia livre.

Em estatística, em particular, na análise de regressão, o ponto de alavanca é uma medida dos valores de observação da variável independente.

Os computadores modernos para análise estatística incluem, como parte das instalações para a análise de regressão, algumas medidas quantitativas que identificam as influências dos dados: entre essas medidas esta a o ponto de alavancagem parcial, uma medida de como uma variável contribui para alavancar o ponto de referência.[1][2]

Modelo de Regressão Linear[editar | editar código-fonte]

No modelo de regressão linear , o ponto de alavanca para a i-ésima unidade de dados é definido como:

o elemento da matriz de projeção , onde é a matriz de projeto.

e são as medida de ajustes e observação, respectivamente.

Limites do ponto de alavanca[editar | editar código-fonte]

Prova[editar | editar código-fonte]

Primeiro, note que H é uma matriz idempotente: Como também, observe que a é simétrica. Desse nodo, quando igualamos a ii elemento de H ao H 2, nos temos

e

Efeitos do desvio residual[editar | editar código-fonte]

Se temos uma ordinário dos mínimos quadrados com uma configuração fixa de X, erros de regressão e

em seguida, onde (onde o i-ésimo é a regressão residual).

Em outras palavras, se o modelo de erros é homoscedástico, a observação do ponto de alavancagem determina o grau de diferenças no modelo de desvio de ramo dessa observação.

Antecipadamente, observe que é idempotente e simétrica. Isso significa,

Resíduos de studentizados[editar | editar código-fonte]

Os resíduos de studentizados — são resíduos ajustados para sua observação específica residual de variância e, em seguida, é

onde é uma estimativa apropriada de

  • Matriz de projeção – one as entradas da diagonal principal são os pontos de alavancagens de observações
  • Mahalanobis a distância – uma medida de alavancagem de um ponto de referência
  • Distância de Cook– uma medida de alterações nos coeficientes de regressão quando uma observação é eliminado
  • DFFITS
  • Os Outliers – extremos valores de Y nas observações

Referências

  1. Cardinali, C. (2013). Data Assimilation: Observation influence diagnostic of a data assimilation system (PDF). [S.l.]: ECMWF Publications 
  2. Everitt, B.S. (2002). Cambridge Dictionary of Statistics. [S.l.]: Cambridge University Press. ISBN 0-521-81099-X