Modelagem de equações estruturais

Origem: Wikipédia, a enciclopédia livre.
An example structural equation model
Figura 1. Um exemplo de modelo de equação estrutural. As variáveis latentes são normalmente indicadas com ovais e as variáveis observadas são mostradas em retângulos. Resíduos e variações são desenhados como setas de duas pontas (mostradas aqui) ou setas simples e um círculo. Observe que a variação latente do QI é fixada em 1 para fornecer escala ao modelo. A Figura 1 mostra os erros de medição influenciando cada indicador de inteligência latente e cada indicador de realização latente. Nem os indicadores nem os erros de medição dos indicadores são modelados como influenciando as variáveis latentes, mas poderiam se o pesquisador optasse por modelá-los.

Modelagem de equações estruturais (structural equation modeling ou SEM em inglês) é um rótulo para um conjunto diversificado de métodos usados por cientistas em pesquisas experimentais e observacionais nas ciências, negócios [1] e outros campos. É mais usado nas ciências sociais e comportamentais.

SEM envolve a construção de um modelo, uma representação informativa de algum fenômeno observável ou teórico. Neste modelo, diferentes aspectos de um fenômeno são teorizados para serem relacionados uns aos outros com uma estrutura. Essa estrutura é um sistema de equações, mas geralmente é projetada em papel ou usando um computador com setas e símbolos (também conhecido como notação de caminho, conforme mostrado na Figura 1). A estrutura implica relações estatísticas e muitas vezes causais entre variáveis, termos de erro e pode incluir várias equações. A equação (ou equações) em SEM são propriedades matemáticas e estatísticas que são implícitas no modelo e suas características estruturais, e então estimadas com algoritmos estatísticos (geralmente baseados em álgebra matricial e modelos lineares generalizados) usando dados experimentais ou observacionais.

As críticas aos métodos SEM apontam para problemas de formulação matemática, uma tendência a aceitar modelos sem estabelecer validade externa e viés filosófico inerente aos procedimentos padrão.[2]

Embora nem sempre haja limites claros do que é e o que não é SEM,[3] o processo geralmente envolve modelos de caminho (veja também análise de caminho) e modelos de medição (veja também análise fatorial) e sempre emprega modelos estatísticos e programas de computador para investigar conexões estruturais entre as variáveis latentes subjacentes às variáveis reais extraídas dos dados observados.[4]

O kit de ferramentas SEM inclui análise fatorial confirmatória, análise composta confirmatória, análise de caminho, modelagem multigrupo, modelagem longitudinal, modelagem de caminho de mínimos quadrados parciais, modelagem de crescimento latente e modelagem hierárquica ou multinível.[4] O uso do SEM é comumente justificado nas ciências sociais porque é uma forma de identificar variáveis latentes que se acredita existirem, mas não podem ser observadas diretamente na realidade.[4][5][6]

Um modelo hipotético sugerindo que a inteligência (medida por quatro perguntas) pode prever o desempenho acadêmico (medida pelo SAT, ACT e GPA do ensino médio) é mostrado na Figura 1. O conceito de inteligência humana não pode ser medido diretamente da mesma forma que se pode medir altura ou peso. Em vez disso, os pesquisadores têm uma teoria e conceituação de inteligência e, em seguida, projetam instrumentos de medição, como um questionário ou teste, que fornece vários indicadores de inteligência. Esses indicadores são então combinados em um modelo para criar uma maneira plausível de medir a inteligência como uma variável latente (o círculo para inteligência na Figura 1) a partir dos indicadores (caixas quadradas com escala de 1 a 4 na Figura 1).

História[editar | editar código-fonte]

A modelagem de equações estruturais tem suas raízes no trabalho de Sewall Wright, que aplicou interpretações causais explícitas a equações de regressão baseadas em efeitos diretos e indiretos de variáveis observadas na genética populacional.[7][8] Lee M. Wolfle compilou uma história bibliográfica anotada do método de coeficiente de trajetória de Wright que hoje conhecemos como modelagem de caminho.[9] Wright acrescentou dois elementos importantes à prática padrão de usar a regressão para prever um resultado. Estes foram (1) combinar informações de mais de uma equação de regressão usando (2) uma abordagem causal para modelagem de regressão em vez de meramente preditiva. Wright consolidou seu método de análise de caminhos em seu artigo de 1934 "O Método dos Coeficientes de Caminho".[10]

Otis Dudley Duncan introduziu o método às ciências sociais em 1975 [11] e ele floresceu ao longo dos anos 1970 e 1980. Abordagens de modelagem diferentes, mas matematicamente relacionadas, foram desenvolvidas na psicologia, sociologia e economia. A convergência de duas dessas correntes de desenvolvimento (análise fatorial na psicologia e análise de trajetória na sociologia) produziu o núcleo atual do método, embora haja grande sobreposição com práticas econométricas empregando equações simultâneas e exógenas (variáveis causais).[12]

Abordagem geral para SEM[editar | editar código-fonte]

Embora cada técnica da família SEM seja diferente, os seguintes aspectos são comuns a muitos métodos SEM: 1) Equação (modelo ou especificação de equação), 2) Estimação de parâmetros livres, 3) Avaliação e ajuste de modelos, 4) Explicação e comunicação, bem como execução de resultados.

Especificação do modelo[editar | editar código-fonte]

Dois componentes principais dos modelos são distinguidos no SEM: o modelo estrutural mostrando as potenciais dependências causais entre variáveis endógenas e exógenas, e o modelo de medição mostrando as relações entre as variáveis latentes e seus indicadores. Os modelos de análise fatorial exploratória e confirmatória, por exemplo, contêm apenas a parte de medição, enquanto os diagramas de caminho podem ser vistos como SEMs que contêm apenas a parte estrutural.

Estimativa de parâmetros livres[editar | editar código-fonte]

A estimação dos parâmetros é feita comparando as matrizes de covariância reais que representam as relações entre as variáveis e as matrizes de covariância estimadas do modelo de melhor ajuste. Isso é obtido por meio da maximização numérica via maximização de expectativa de um critério de ajuste conforme fornecido pela estimativa de máxima verossimilhança, estimativa de quase máxima verossimilhança, mínimos quadrados ponderados ou métodos assintoticamente livres de distribuição.

Avaliação de modelos e ajuste de modelo[editar | editar código-fonte]

Tendo estimado um modelo, os analistas desejarão interpretá-lo. Os caminhos estimados podem ser tabulados e/ou apresentados graficamente como um modelo de caminho. O impacto das variáveis é avaliado usando regras de rastreamento de caminho.

Modificação do modelo[editar | editar código-fonte]

O modelo pode precisar ser modificado para melhorar o ajuste, estimando assim as relações mais prováveis entre as variáveis. Muitos programas fornecem índices de modificação que podem orientar pequenas mudanças. Os índices de modificação relatam a mudança em χ² que resulta da liberação de parâmetros fixos: geralmente, portanto, adicionando um caminho a um modelo que está atualmente definido como zero. As modificações que melhoram o ajuste do modelo podem ser sinalizadas como possíveis alterações que podem ser feitas no modelo. Modificações em um modelo, especialmente o modelo estrutural, são mudanças na teoria alegada como verdadeira. As modificações, portanto, devem fazer sentido em termos da teoria que está sendo testada, ou ser reconhecidas como limitações dessa teoria. Mudanças no modelo de mensuração são efetivamente afirmações de que os itens/dados são indicadores impuros das variáveis latentes especificadas pela teoria.

Tamanho e potência da amostra[editar | editar código-fonte]

Embora os pesquisadores concordem que grandes tamanhos de amostra são necessários para fornecer potência estatística suficiente e estimativas precisas usando SEM, não há consenso geral sobre o método apropriado para determinar o tamanho adequado da amostra. [13] Geralmente, as considerações para determinar o tamanho da amostra incluem o número de observações por parâmetro, o número de observações necessárias para que os índices de ajuste funcionem adequadamente e o número de observações por grau de liberdade. [13] Pesquisadores propuseram diretrizes baseadas em estudos de simulação, experiência profissional e fórmulas matemáticas.

Explicação e comunicação[editar | editar código-fonte]

O conjunto de modelos é então interpretado para que as afirmações sobre os construtos possam ser feitas, com base no modelo de melhor ajuste.

Software específico para SEM[editar | editar código-fonte]

Existem também vários pacotes para o ambiente estatístico de software livre R. O pacote OpenMx R fornece uma versão de código aberto e aprimorada do aplicativo Mx. Outro pacote R de código aberto para SEM é o lavaan.

Os estudiosos consideram uma boa prática relatar qual pacote de software e versão foram usados para análise SEM porque eles têm recursos diferentes e podem usar métodos ligeiramente diferentes para executar técnicas com nomes semelhantes. [14]

Veja também[editar | editar código-fonte]

Referências[editar | editar código-fonte]

  1. Shelley, Mack C (2006). «Structural Equation Modeling». Encyclopedia of Educational Leadership and Administration. [S.l.: s.n.] ISBN 978-0-7619-3087-7. doi:10.4135/9781412939584.n544 
  2. Tarka, Piotr (2017). «An overview of structural equation modeling: Its beginnings, historical development, usefulness and controversies in the social sciences». Quality & Quantity. 52 (1): 313–54. PMC 5794813Acessível livremente. PMID 29416184. doi:10.1007/s11135-017-0469-8 
  3. Curran, Patrick J. (1 de outubro de 2003). «Have Multilevel Models Been Structural Equation Models All Along?». Multivariate Behavioral Research. 38 (4): 529–569. ISSN 0027-3171. PMID 26777445. doi:10.1207/s15327906mbr3804_5 
  4. a b c Kline, Rex B. (2016). Principles and practice of structural equation modeling 4th ed. New York: [s.n.] ISBN 978-1-4625-2334-4. OCLC 934184322 
  5. Bollen, Kenneth A. (1989). Structural equations with latent variables. New York: Wiley. ISBN 0-471-01171-1. OCLC 18834634 
  6. Kaplan, David (2009). Structural equation modeling: foundations and extensions 2nd ed. Los Angeles: SAGE. ISBN 978-1-4129-1624-0. OCLC 225852466 
  7. Wright, S. (1 de junho de 1920). «The Relative Importance of Heredity and Environment in Determining the Piebald Pattern of Guinea-Pigs». Proceedings of the National Academy of Sciences (em inglês). 6 (6): 320–332. Bibcode:1920PNAS....6..320W. ISSN 0027-8424. PMC 1084532Acessível livremente. PMID 16576506. doi:10.1073/pnas.6.6.320Acessível livremente 
  8. Wright, Sewall (1921). «Journal of Agricultural Research». Journal of Agricultural Research. 20 (1): 557–585 – via USDA 
  9. Wolfle, Lee M. (1999). «Sewall wright on the method of path coefficients: An annotated bibliography». Structural Equation Modeling: A Multidisciplinary Journal (em inglês). 6 (3): 280–291. ISSN 1070-5511. doi:10.1080/10705519909540134 
  10. Wright, Sewall (1934). «The Method of Path Coefficients». The Annals of Mathematical Statistics. 5 (3): 161–215. ISSN 0003-4851. JSTOR 2957502. doi:10.1214/aoms/1177732676 
  11. Duncan, Otis Dudley (1975). Introduction to structural equation models. New York: Academic Press. ISBN 0-12-224150-9. OCLC 1175858 
  12. Christ, Carl F. (1994). «The Cowles Commission's Contributions to Econometrics at Chicago, 1939-1955». Journal of Economic Literature. 32 (1): 30–59. ISSN 0022-0515. JSTOR 2728422 
  13. a b Quintana & Maxwell 1999, p. 499.
  14. Kline 2011, p. 79-88.