Regressão linear
Em estatística ou econometria, regressão linear é um método para se estimar a condicional (valor esperado) de uma variável y, dados os valores de algumas outras variáveis x.
A regressão, em geral, trata da questão de se estimar um valor condicional esperado.
A regressão linear é chamada "linear" porque se considera que a relação da resposta às variáveis é uma função linear de alguns parâmetros. Os modelos de regressão que não são uma função linear dos parâmetros se chamam modelos de regressão não-linear. Sendo uma das primeiras formas de análise regressiva a ser estudada rigorosamente, e usada extensamente em aplicações práticas. Isso acontece porque modelos que dependem de forma linear dos seus parâmetros desconhecidos, são mais fáceis de ajustar que os modelos não-lineares aos seus parâmetros, e porque as propriedades estatísticas dos estimadores resultantes são fáceis de determinar.1
Índice |
Equação da Regressão Linear [editar]
Para se estimar o valor esperado, usa-se de uma equação, que determina a relação entre ambas as variáveis.

Em que:
- Variável explicada (dependente); é o valor que se quer atingir;
- É uma constante, que representa a interceptação da reta com o eixo vertical;
- É outra constante, que representa o declive da reta;
- Variável explicativa (independente), representa o factor explicativo na equação;
- Variável que inclui todos os factores residuais mais os possíveis erros de medição. O seu comportamento é aleatório, devido à natureza dos factores que encerra. Para que essa fórmula possa ser aplicada, os erros devem satisfazer determinadas hipóteses, que são: serem variáveis normais, com a mesma variância
(desconhecida), independentes e independentes da variável explicativa X.
Cálculo dos fatores
e
[editar]
Definindo
e
, temos que
e
se relacionam por:
Desenvolvimento [editar]
Estas fórmulas podem ser desenvolvidas a partir da definição de mínimos quadrados
O objectivo é determinar
e
de forma que a soma dos quadrados dos erros seja mínima, ou seja, devemos minimizar
Desenvolvendo este quadrado e eliminando os termos constantes (ou seja, aqueles que não têm termos em
e
, chega-se a:
A partir desse ponto, pode-se resolver usando-se cálculo (tomando as derivadas parciais, etc), ou através de uma transformação de coordenadas:
ou
Transformando a expressão a ser minimizada em:
ou
Esta expressão se separa na soma de duas expressões quadráticas independentes, que podem ser minimizadas usando matemática elementar:
Cujos valores minimizadores são:
Memorização [editar]
Uma forma fácil de memorizar esta expressão é escrever:
e, em seguida, somar as colunas:
Intervalos de confiança [editar]
O valor estimado de
,
, deve ser analisado através da distribuição t de Student, porque
tem a distribuição t de Student com n-2 graus de liberdade (ver Fisher, R. A. (1925). "Applications of "Student's" distribution". Metron 5: 90–104.), em que:
A variância de
,
pode ser estimada através dos erros observados:
se distribui como uma Chi quadrado com n-2 graus de liberdade.
Ver também [editar]
Ligações Externas [editar]
- SysLinea 0.1.2 : Programa de código aberto com regressão linear e não linear.
Referências
- ↑ http://www.fisica.ufs.br/egsantana/cinematica/regresion/regresion.htm Regressão linear com experimêntos físicos
Bibliografia [editar]
- REIS, E., Estatistica Descritiva (2ª ed.). Lisboa: Edições Sílabo, 1994




















