Modelo linear: diferenças entre revisões

Origem: Wikipédia, a enciclopédia livre.
Conteúdo apagado Conteúdo adicionado
m →‎top: Colocação de Predefinição utilizando AWB
WilsonNeuroMat (discussão | contribs)
Inserção de conteúdo traduzido do verbete em inglês. Adaptação de conteúdo em português.
Linha 1: Linha 1:
{{Estatística sidebar}}
Em [[estatística]], o termo '''modelo linear''' é usado de diferentes maneiras de acordo com o contexto. O sentido mais comum é em com conexão com modelos de regressão e o termo é frequentemente tomado como um sinônimo de modelo de [[regressão linear]]. Entretanto o termo é também usado em análise de [[Série temporal|séries temporais]] com um diferente significado. Em cada caso, a designação "linear" é usada para identificar uma subclasse de modelos para os quais redução substancial na complexidade da [[teoria estatística]] relacionada é possível.
Em [[estatística]], o termo '''modelo linear''' é usado de diferentes formas de acordo com o contexto. A ocorrência mais comum se dá em conexão com modelos de regressão e o termo é frequentemente assumido como sinônimo de modelo de [[regressão linear]]. Entretanto, o termo é também usado em análise de [[Série temporal|séries temporais]] com um significado diferente. Em cada caso, a designação "linear" é frequentemente usada para identificar uma subclasse de modelos para os quais uma redução substancial na complexidade da teoria estatística relacionada é possível.<ref>{{Citar livro|url=https://www.worldcat.org/oclc/6164035|título=Multivariate analysis|ultimo=Mardia|primeiro=K. M.|ultimo2=Kent|primeiro2=J. T.|ultimo3=Bibby|primeiro3=J. M.|editora=Academic Press|ano=1979|local=London|isbn=0124712525|oclc=6164035}}</ref>


==Modelos de regressão linear==
{{main|Regressão linear}}


Para o caso da regressão, o [[modelo estatístico]] é como segue. Dada uma [[Amostra (estatística)|amostra]] (aleatória) <math> (Y_i,X_{i1},\ldots,X_{ip}),i =1,\ldots,n </math>, a relação entre as observações <math> Y_i </math> e as [[Variáveis dependentes e independentes|variáveis independentes]] <math> X_{ij} </math> é formulada como:<blockquote><math>Y_i=\beta_0 +\beta_1\phi_1(X_{i1})+\cdots+\beta_p\phi_p(X_{ip})+\varepsilon_i\qquad i=1,\ldots,n; </math></blockquote>em que <math> \phi_1,\ldots,\phi_p </math> podem ser funções não lineares. Acima, as quantidades <math> \varepsilon_i </math> são variáveis aleatórias que representam os erros na relação. A parte "linear" da designação se relaciona com o aparecimento dos coeficientes de regressão <math> \beta_j </math> em uma forma linear na relação acima. Alternativamente, pode-se dizer que os valores previstos correspondentes ao modelo acima, mais precisamente:<blockquote><math>\hat{Y}_i=\beta_0+\beta_1\phi_1(X_{i1})+\cdots+\beta_p\phi_p(X_{ip})\qquad(i=1,\ldots,n), </math></blockquote>são funções lineares dos <math>\beta_j </math>.

Dado que a estimativa é realizada com base em um análise de [[Método dos mínimos quadrados|mínimos quadrados]], estimativas dos parâmetros desconhecidos <math>\beta_j </math> são determinadas ao minimizar uma função de soma de quadrados:<blockquote><math>S=\sum_{i = 1}^n\left(Y_i-\beta_0-\beta_1\phi_1(X_{i1})-\cdots-\beta_p\phi_p(X_{ip})\right)^2 .</math><ref>{{citar periódico|ultimo=Friston|primeiro=K. J.|ultimo2=Holmes|primeiro2=A. P.|ultimo3=Worsley|primeiro3=K. J.|ultimo4=Poline|primeiro4=J. -P.|ultimo5=Frith|primeiro5=C. D.|ultimo6=Frackowiak|primeiro6=R. S. J.|ano=1994|titulo=Statistical Parametric Maps in functional imaging: A general linear approach|url=http://onlinelibrary.wiley.com/doi/10.1002/hbm.460020402/abstract|jornal=Human Brain Mapping|acessodata=20/02/2018}}</ref></blockquote>A partir disto, pode-se ver prontamente que o aspecto "linear" do modelo significa o seguinte:
:*A função a ser minimizada é uma função quadrática dos <math>\beta_j </math>, para a qual a minimização é um problema relativamente simples;
:*As derivadas da função são funções lineares dos <math>\beta_j </math>, o que torna mais fácil encontrar os valores minimizantes;
:*Os valores minimizantes <math>\beta_j </math> são funções lineares das observações <math>Y_i</math>;
:*Os valores minimizantes <math>\beta_j </math> são funções lineares dos erros aleatórios <math> \varepsilon_i </math>, o que torna relativamente fácil determinar as propriedades estatísticas dos valores estimados dos <math>\beta_j </math>.<ref>{{Citar livro|url=https://www.worldcat.org/oclc/775437886|título=Linear regression analysis|ultimo=Seber|primeiro=George A. F.|ultimo2=Lee|primeiro2=Alan J.|editora=Wiley-Interscience|ano=2003|edicao=2|local=Hoboken, N.J.|isbn=9781118274422|oclc=775437886}}</ref>

==Modelos de séries temporais==
Um exemplo de um modelo linear de série temporal é um modelo [[ARMA]]. Aqui, o modelo para valores <math>\{X_t\}</math> em uma série temporal pode ser escrito na forma:<blockquote><math> X_t=c+\varepsilon_t+\sum_{i=1}^p\phi_i X_{t-i}+\sum_{i=1}^q\theta_i\varepsilon_{t-i},</math></blockquote>em que novamente as quantidades <math> \varepsilon_t</math> são variáveis aleatórias que representam inovações, que são novos efeitos aleatórios que aparecem em um certo tempo, mas que também afetam valores de <math> X</math> em tempos posteriores. Neste exemplo, o uso do termo "modelo linear" se refere à estrutura da relação acima ao representar <math> X_t</math> como uma função linear dos valores passados da mesma série temporal e dos valores presentes e passados das inovações. Este aspecto particular da estrutura significa que é relativamente simples derivar relações para as propriedades de [[média]] e [[covariância]] da série temporal. Nota-se que aqui a parte "linear" do termo "modelo linear" não está se referindo ao coeficientes <math> \varphi_i</math> e <math> \theta_i</math>, como seria no caso de um modelo de regressão, que parece estruturalmente semelhante.<ref>{{Citar livro|url=https://www.worldcat.org/oclc/24107579|título=Non-linear and non-stationary time series analysis|ultimo=Priestley|primeiro=Maurice Bertram|editora=Academic Press|ano=1998|local=London|isbn=0125649118|oclc=24107579}}</ref>

==Outros usos em estatística==
Há algumas outras instâncias em que "modelo não linear" é usado para contrastar com um modelo linearmente estruturado, embora o termo "modelo linear" não seja usualmente aplicado. Um exemplo disto é a redução de dimensionalidade não linear.<ref>{{Citar livro|url=https://www.worldcat.org/oclc/191448634|título=Nonlinear dimensionality reduction|ultimo=Lee|primeiro=John Aldo|ultimo2=Verleysen|primeiro2=Michel|editora=Springer|ano=2007|local=New York|isbn=9780387393513|oclc=191448634}}</ref>

==Ver também==
* [[Modelo estatístico]]
* [[Modelo linear generalizado]]

==Referências==
{{Reflist}}


{{Portal3|Probabilidade e Estatística}}
{{Portal3|Probabilidade e Estatística}}


[[Categoria:Análise de regressão]]
{{DEFAULTSORT:Modelo Linear}}
[[Categoria:Estatística]]
[[Categoria:Estatística]]
[[Categoria:Mineração de dados]]

[[ar:نموذج الانحدار الخطي]]
[[de:Lineares Modell]]

Revisão das 15h48min de 20 de fevereiro de 2018

Em estatística, o termo modelo linear é usado de diferentes formas de acordo com o contexto. A ocorrência mais comum se dá em conexão com modelos de regressão e o termo é frequentemente assumido como sinônimo de modelo de regressão linear. Entretanto, o termo é também usado em análise de séries temporais com um significado diferente. Em cada caso, a designação "linear" é frequentemente usada para identificar uma subclasse de modelos para os quais uma redução substancial na complexidade da teoria estatística relacionada é possível.[1]

Modelos de regressão linear

Ver artigo principal: Regressão linear

Para o caso da regressão, o modelo estatístico é como segue. Dada uma amostra (aleatória) , a relação entre as observações e as variáveis independentes é formulada como:

em que podem ser funções não lineares. Acima, as quantidades são variáveis aleatórias que representam os erros na relação. A parte "linear" da designação se relaciona com o aparecimento dos coeficientes de regressão em uma forma linear na relação acima. Alternativamente, pode-se dizer que os valores previstos correspondentes ao modelo acima, mais precisamente:

são funções lineares dos . Dado que a estimativa é realizada com base em um análise de mínimos quadrados, estimativas dos parâmetros desconhecidos são determinadas ao minimizar uma função de soma de quadrados:

[2]

A partir disto, pode-se ver prontamente que o aspecto "linear" do modelo significa o seguinte:

  • A função a ser minimizada é uma função quadrática dos , para a qual a minimização é um problema relativamente simples;
  • As derivadas da função são funções lineares dos , o que torna mais fácil encontrar os valores minimizantes;
  • Os valores minimizantes são funções lineares das observações ;
  • Os valores minimizantes são funções lineares dos erros aleatórios , o que torna relativamente fácil determinar as propriedades estatísticas dos valores estimados dos .[3]

Modelos de séries temporais

Um exemplo de um modelo linear de série temporal é um modelo ARMA. Aqui, o modelo para valores em uma série temporal pode ser escrito na forma:

em que novamente as quantidades são variáveis aleatórias que representam inovações, que são novos efeitos aleatórios que aparecem em um certo tempo, mas que também afetam valores de em tempos posteriores. Neste exemplo, o uso do termo "modelo linear" se refere à estrutura da relação acima ao representar como uma função linear dos valores passados da mesma série temporal e dos valores presentes e passados das inovações. Este aspecto particular da estrutura significa que é relativamente simples derivar relações para as propriedades de média e covariância da série temporal. Nota-se que aqui a parte "linear" do termo "modelo linear" não está se referindo ao coeficientes e , como seria no caso de um modelo de regressão, que parece estruturalmente semelhante.[4]

Outros usos em estatística

Há algumas outras instâncias em que "modelo não linear" é usado para contrastar com um modelo linearmente estruturado, embora o termo "modelo linear" não seja usualmente aplicado. Um exemplo disto é a redução de dimensionalidade não linear.[5]

Ver também

Referências

  1. Mardia, K. M.; Kent, J. T.; Bibby, J. M. (1979). Multivariate analysis. London: Academic Press. ISBN 0124712525. OCLC 6164035 
  2. Friston, K. J.; Holmes, A. P.; Worsley, K. J.; Poline, J. -P.; Frith, C. D.; Frackowiak, R. S. J. (1994). «Statistical Parametric Maps in functional imaging: A general linear approach». Human Brain Mapping. Consultado em 20 de fevereiro de 2018 
  3. Seber, George A. F.; Lee, Alan J. (2003). Linear regression analysis 2 ed. Hoboken, N.J.: Wiley-Interscience. ISBN 9781118274422. OCLC 775437886 
  4. Priestley, Maurice Bertram (1998). Non-linear and non-stationary time series analysis. London: Academic Press. ISBN 0125649118. OCLC 24107579 
  5. Lee, John Aldo; Verleysen, Michel (2007). Nonlinear dimensionality reduction. New York: Springer. ISBN 9780387393513. OCLC 191448634