Função correlograma

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

Em análise de dados, um correlograma é uma imagem da estatística da correlação. Em análise de séries temporais, por exemplo, um correlograma, também conhecido como diagrama de autocorrelação, é um diagrama das autocorrelações da amostra versus (os intervalos de tempo).

Se a relação cruzada for usada, o resultado é chamado de correlograma cruzado. O correlograma é uma ferramenta comumente usado para checar a aleatoriedade de um conjunto de dados. Esta aleatoriedade é verificada ao computar autocorrelações para valores de dados em intervalo de tempo variantes. Em caso de aleatoriedade, tais autocorrelações devem ser próximas de zero para quaisquer e todas as separações de intervalo de tempo. Em caso de não aleatoriedade, então uma ou mais autocorrelações devem ser significantemente diferentes de zero.

Além disso, correlogramas são usados no estágio da identificação de modelo para os modelos de série temporal autorregressivos de médias móveis de Box-Jenkins. Autocorrelações devem ser próximas de zero para aleatoriedade. Se o analista não verificar a aleatoriedade, então, a validade de muitas conclusões estatísticas se torna suspeita. O correlograma é uma forma adequada de checar tal aleatoriedade.

Por vezes, corgramas, matrizes coloridas de forças de correlação em análise multivariada,[1] também são chamados de correlogramas.[2][3]

Aplicações[editar | editar código-fonte]

Uma diagrama que mostra 100 números aleatórios com uma função seno "oculta" e uma autocorrelação (correlograma) na parte inferior.

O correlograma pode ajudar a fornecer respostas para as seguintes questões:[4]

  • Os dados são aleatórios?
  • A observação está relacionada a uma observação adjacente?
  • A observação está relacionada a uma observação duplamente removida?
  • A série temporal observada é ruído branco?
  • A série temporal observada é senoide?
  • A série temporal observada é autorregressiva?
  • Qual é o modelo apropriado para a série temporal observada?
  • O modelo é válido e suficiente?
  • A fórmula é válida?

Definição[editar | editar código-fonte]

Exemplo para um correlograma.

O estimador de covariância não centrada é dado pela média do produto de amostras que se encontram à distância de :[5]

Para obter o estimador centrado, é necessário subtrair o produto das médias das amostras que se encontrem nos pares distânciados por :

em que

e

A partir da covariância, podemos calcular o correlograma:

Dado que a covariância tem relação direta com o variograma, em que é o patamar,

também o correlograma tem relação direta com a variância

.

Importância[editar | editar código-fonte]

A aleatoriedade, ao lado do modelo fixo, da variação fixa e da distribuição fixa, é um dos quatro pressupostos que subjazem tipicamente todos os processos de mensuração. O pressuposto da aleatoriedade é criticamente importante por três razões:[4]

  • A maioria dos testes estatísticos padrão depende de aleatoriedade. A validade das conclusões dos testes é diretamente ligada à validade do pressuposto de aleatoriedade.
  • Muitas fórmulas estatísticas comumente usadas dependem do pressuposto de aleatoriedade, sendo a mais comum destas a fórmula que determina o desvio padrão da média amostral:
em que é o desvio padrão dos dados. Ainda que amplamente usada, os resultados do uso desta fórmula não têm valor a não ser que o pressuposto de aleatoriedade se aplique.
  • Para dados univariados, o modelo padrão é
Se os dados não forem aleatórios, este modelo é incorreto e inválido e os valores estimados para tais parâmetros (tal como a constante) se tornam inválidos e desprovidos de sentido.

Estimação de autocorrelações[editar | editar código-fonte]

O coeficiente de autocorrelação no intervalo é dado por

em que é a função autocovariância

e é a função variância

O valor resultante de estará entre e .[6]

Estimativa alternativa[editar | editar código-fonte]

Algumas fontes podem usar a seguinte fórmula para a função autocovariância:

Ainda que esta definição tenha menos viés, a formulação tem algumas propriedades estatísticas desejáveis e é a forma mais comumente usada em literatura estatística.[7]

Inferência estatística com correlogramas[editar | editar código-fonte]

No mesmo grafo, é possível definir limites superiores e inferiores para autocorrelação com nível de significância :

com como a autocorrelação estimada no intervalo .

Se a autocorrelação for maior do que o limite superior ou menor do que o limite inferior, a hipótese nula de que não há autocorrelação em e além de um dado intervalo é rejeitada ao nível de significância . O teste é de tipo aproximado e assume que a série temporal é gaussiana.[6]

Na descrição acima, é o quantil da distribuição normal, é o desvio padrão, que pode ser computado pela fórmula de M. S. Bartlett para processos :

para

Na imagem acima, é possível rejeitar a hipótese nula de que não há autocorrelação entre os pontos de tempos que são adjacentes (intervalo igual a 1). Para outros períodos, não é possível rejeitar a hipótese nula de nenhuma autocorrelação.

Note que há duas fórmulas distintas para gerar os intervalos de confiança:

1. Se o correlograma estiver sendo usando para testar aleatoriedade, isto é, ver se não há dependência de tempo nos dados, a seguinte fórmula é recomendada:
em que é o tamanho da amostra, é a função quantil da distribuição normal padrão e é o nível de significância. Neste caso, os intervalos de confiança têm amplitude fixa que depende do tamanho da amostra.
2. Correlogramas também são usados no estágio de identificação de modelo para ajuste de modelos autorregressivos integrados de média móvel. Neste caso, um modelo de média móvel é pressuposto para os dados e os seguintes intervalos de confiança devem ser gerados:
em que é o intervalo. Neste caso, os intervalos de confiança aumentam conforme o intervalo aumenta.

Ver também[editar | editar código-fonte]

Referências[editar | editar código-fonte]

  1. Friendly, Michael (1 de novembro de 2002). «Corrgrams». The American Statistician. 56 (4): 316–324. ISSN 0003-1305. doi:10.1198/000313002533 
  2. Wright, Kevin. «Plot a Correlogram [R package corrgram version 1.12]» 
  3. robk@statmethods.net, Robert Kabacoff -. «Quick-R: Correlograms». www.statmethods.net. Consultado em 18 de julho de 2017 
  4. a b Hanke, John E.; Wichern, Dean W. (12 de fevereiro de 2014). Business Forecasting (em inglês). [S.l.]: Pearson Higher Ed. ISBN 9780133796087 
  5. Soares, Amílcar. Geoestatística para as ciências da terra e do ambiente. [S.l.]: Instituto Superior. ISBN 9789728469467 
  6. a b Box, George E. P.; Jenkins, Gwilym M. (1976). Time series analysis: forecasting and control (em inglês). [S.l.]: Holden-Day. ISBN 9780816211043 
  7. Chatfield, Chris (30 de março de 2016). The Analysis of Time Series: An Introduction, Sixth Edition (em inglês). [S.l.]: CRC Press. ISBN 9780203491683 

Ligações externas[editar | editar código-fonte]