Série temporal

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa
Séries temporal, aleatória e sazonal

Em estatística, econometria, matemática aplicada e processamento de sinais, uma série temporal é uma coleção de observações feitas sequencialmente ao longo do tempo. Em modelos de regressão linear com dados cross-section a ordem das observações é irrelevante para a análise, em séries temporais a ordem dos dados é fundamental. Uma característica muito importante deste tipo de dados é que as observações vizinhas são dependentes e o interesse é analisar e modelar esta dependência.

As séries temporais existem nas mais variadas áreas de aplicação, como: finanças, marketing, ciências econômicas, seguros, demografia, ciências sociais, meteorologia, energia, epidemiologia, etc.

Definição formal[editar | editar código-fonte]

Uma série temporal é uma sequência de realizações (observações) de uma variável ao longo do tempo1 . Dito de outra forma, é uma sequência de pontos (dados numéricos) em ordem sucessiva, geralmente ocorrendo em intervalos uniformes. Portanto, uma série de tempo é simplesmente uma sequência de números coletados em intervalos regulares durante um período de tempo.

São séries temporais NÃO são séries temporais
Uma série que mostre a temperatura diária de alguma cidade. O primeiro dado representa a temperatura do primeiro dia e assim por diante. Na série abaixo, as diferentes realizações da variável (=diferentes temperaturas coletadas, uma em cada dia) são separadas por vírgula: T= \left \{ 19, 18, 17, 15, 18, 21 \right\} = temperatura média coletada por algum pesquisador em alguma cidade, ao longo de vários dias Um conjunto de dados sobre a temperatura de uma certa cidade, em diferentes bairros, tendo a coleta sido realizada no mesmo dia.
Número de homicícios anuais em determinado país1 :H= \left \{ 191, 100, 156, 134, 201, 98 \right\} Número de homicídios de um certo país em determinado ano, em diferentes regiões
Salário de certo indivíduo em cada mês de um certo ano Salário dos habitantes de uma cidade em janeiro de 2011.

Em Economia[editar | editar código-fonte]

Na ciência econômica, desde o trabalho de Trygve Haavelmo, tem sido padrão para visualizar séries temporais econômicas como realizações de processos estocásticos. Esta abordagem permite que o construtor do modelo econômico use a inferência estatística para construir e testar equações que caracterizam as relações entre variáveis ​​econômicas2 . Note-se que esta definição pressupõe que a série temporal contenha um componente estocástico, o que é verdade na vasta maioria dos casos práticos.

São exemplos de séries temporais utilizadas em economia:

  • Preço, minuto a minuto, da ação de certa empresa na bolsa de valores1 :
P= \left \{ 8, 5, 5, 4, 6, 5 \right\}
  • Vendas mensais de carros1 :
V= \left \{ 8000, 7600, 4002, 6632 \right\}

Convenções utilizadas para representar uma série temporal[editar | editar código-fonte]

Uma série temporal é geralmente representada por uma letra. A variável representada assume diferentes valores em diferentes momentos do tempo, e por isso utiliza-se um subscrito junto à letra para denotar o período a que o valor específico (realização) se refere. Por exemplo, se a variável "PIB anual do Brasil" for representada pela letra y, podemos denotar por y0 o PIB do primeiro período. O dado do período seguinte seria, neste mesmo caso, y1.

Teríamos, portanto, neste exemplo:

Período em análise Representação deste ano na série temporal Representação do valor assumido pela variável y em cada período Valor efetivamente assumido pela variável y em cada período (PIB do Brasil no ano)
2004 2004={\color{Blue}0} (ano inicial) y_{\color{Blue}0} y_{\color{Blue}0}=1.941.498 \cdot 10^3 reais3 = PIB anual de 2004.
2005 2005={\color{Red}1} y_{\color{Red}1} y_{\color{Red}1}=2.147.239 \cdot 10^3 reais3
2006 2006={\color{OliveGreen}2} y_{\color{OliveGreen}2} y_{\color{OliveGreen}2}=2.369.484 \cdot 10^3 reais3
2007 2007={\color{RubineRed}3} y_{\color{RubineRed}3} y_{\color{RubineRed}3}=2.661.344 \cdot 10^3 reais3

Componentes de uma série temporal[editar | editar código-fonte]

Uma série temporal pode ser genericamente decomposta nos seguintes itens4 :

Componente Descrição É um componente determinístico (fruto de uma equação)? É um componente estocástico (resultado de processo aleatório)?
Tendência Capta elementos de longo prazo relacionados com a série de tempo Pode ser Pode ser
Ciclo Longas ondas, mais ou menos regulares, em torno de uma linha de tendência
Sazonalidade Capta os padrões regulares da série de tempo
Aleatório Capta todos os efeitos que não foram incorporados pela série de tempo via os três componentes anteriormente citados, ou seja, é o resíduo Não Sempre

Lei de formação das séries temporais[editar | editar código-fonte]

Três funções lineares. Se o eixo "x" representar alguma variável explicativa ao longo do tempo, então estas funções são séries temporais que contém apenas o componente determinístico

As séries temporais são muitas vezes representadas por meio de funções matemáticas, ou seja, assume-se que o valor obtido é função de alguma outra variável (ou de diversas variáveis), ou, o que é a mesma coisa, que existe uma lei de formação que determina esta série temporal.

A função que determina a série temporal não precisa ser sempre linear. Na verdade, ela pode ter qualquer formato (quadrática, exponencial...) e pode depender de mais de uma variável. No entanto, uma boa parte da (mas não toda a) econometria trata apenas de funções lineares, que são mais fáceis de modelar.

Os componentes de uma série temporal podem ser determinísticos e/ou estocásticos.

Componente determinístico[editar | editar código-fonte]

Quando os valores da série podem ser escritos através de uma função matemática perfeitamente determinada por uma ou mais variáveis, diz-se que ela contém apenas o componente determinístico.

Exemplo 1[editar | editar código-fonte]

Tome-se a seguinte função linear, que chamaremos de função "f":

Função teórica Exemplo de forma que esta função pode assumir
y_t=a+b \cdot x_t y_t=1+2 \cdot x_t (linha verde na figura ao lado)

Nesta função, a variável y_t depende de, ou é determinada pela, variável x_t. Matematicamente, poderíamos representar também de outra forma: y=f(x).

A convenção utilizada nesta série temporal é a seguinte:

  • y representa o dado obtido.
  • a representa o intercepto
  • x representa a variável que determina y.
  • o subscrito "t" indica o período à qual o dado se refere.

Se fôssemos analisar a função y_t=1+2 \cdot x_t a partir do período em que x=0, teríamos:

Período Valor assumido por x (informação coletada pelo pesquisador) Valor assumido por y (consequência do valor que x assumiu)
t=0 x_0=0 y_0=1+2 \cdot x_0=1+2 \cdot 0=1
t=1 x_1=1 y_1=1+2 \cdot x_1=3
t=2 x_2=2 y_2=1+2 \cdot x_2=5

Exemplo 2[editar | editar código-fonte]

Como o PIB do Brasil é sempre (perfeitamente) determinado pela soma do PIBs das cinco regiões, podemos escrever a seguinte lei de formação da série temporal yt:

y_t=n_t+ne_t+se_t+s_t+co_t

onde:

y_t=PIB do Brasil no ano "t",
n_t=PIB da Região Norte no ano "t",
ne_t=PIB da Região Nordeste no ano "t",
se_t=PIB da Região Sudeste no ano "t",
s_t=PIB da Região Sul no ano "t" e
co_t=PIB da Região Centro-Oeste no ano "t"

Note que, como esta relação é sempre perfeita (não existe possibilidade de o PIB nacional ser maior ou menor que a soma dos PIBs regionais), diz-se que esta série temporal (yt) contém apenas o componente determinístico.

Componente estocástico[editar | editar código-fonte]

Além dos componentes normais de uma função matemática perfeitamente determinada, a representação de uma série temporal pode incluir um componente aleatório (=estocástico), normalmente representado por \epsilon_t ou u_t. Um exemplo de série temporal com componente aleatório é:

y_t = \begin{matrix} \underbrace{ a + b \cdot x_t } \\ \mbox{determinístico} \end{matrix} + \begin{matrix} \underbrace{ \epsilon_t } \\ \mbox{estocástico} \end{matrix}

Neste caso (=quando a lei de formação contém um componente estocástico ou aleatório), a série temporal é denominada estocástica. Note-se que uma série estocástica yt pode ou não conter um componente determinístico: o que a caracteriza é o fato de não se poder determinar, a priori, o valor que assumirá, pois sua lei de formação contém um componente aleatório provém de alguma distribuição de probabilidade, tipicamente a distribuição normal.

Exemplo 1[editar | editar código-fonte]

Suponha que dois irmãos façam uma aposta anual em dinheiro. A quantidade de dinheiro a ser paga ao irmão 1 é determinada pela mesma série temporal acima:

g_t = a + b \cdot x_t + \varepsilon_t

onde

  • g_t é o valor em reais que o irmão 1 vai receber. Se o valor for negativo, o irmão 1 deve pagar ao irmão 2, em vez de receber.
  • a= intercepto = -2
  • b= inclinação = 0,2
  • x_t é a o número de anos que o irmão 1 tem no dia da aposta.
  • \epsilon_t é uma variável aleatória com distribuição binomial que assume o valor 10 se chover no dia, e -20 se não chover. Note-se que esta variável introduz a incerteza, pois não se pode saber, a priori, quanto o irmão 1 deverá pagar para, ou receber do, irmão 2.

Assim, teremos:

ano Idade do irmão 1 (variável xt) Choveu? Valor de \epsilon_t (consequência de ter chovido ou não) Valor de g_t = a + b \cdot x_t + \epsilon_t (=valor a ser pago ou recebido)
t={\color{Blue}0} 19 sim 10 g_{\color{Blue}0} = -2 + 0,2 \cdot 19 + 10 = 11,8 reais
t={\color{Red}1} 20 não -20 g_{\color{Red}1} = -2 + 0,2 \cdot 20 -20 = -18 reais
t={\color{OliveGreen}2} 21 sim 10 g_{\color{OliveGreen}2} = -2 + 0,2 \cdot 21 +10 = 12,2 reais
t={\color{RubineRed}3} 22 não -20 g_{\color{RubineRed}3} = -2 + 0,2 \cdot 22 -20 = -17,6 reais

Exemplo 2[editar | editar código-fonte]

Alguns autores afirmam que o desemprego do Brasil é aproximadamente determinado pelos seguintes fatores: produção (PIB); produtividade; salário real e população economicamente ativa5 . É importante enfatizar que esta é uma determinação aproximada. Afinal, o desemprego pode aumentar por outros fatores, como por exemplo o fechamento inesperado de uma grande empresa, um decreto aumentando o salário mínimo para R$ 10 mil reais etc. Portanto, estas variáveis explicam aproximadamente, mas não exatamente, a taxa de desemprego.

Assim, ignorando algumas tecnicalidades para simplificar, poderíamos elaborar a seguinte lei de formação:

d_t=\begin{matrix} \underbrace{ a+b \cdot y_t + c \cdot p_t + d \cdot s_t + e \cdot i_t } \\ \mbox{determinístico} \end{matrix} + \begin{matrix} \underbrace{ \varepsilon_t } \\ \mbox{estocástico} \end{matrix}

onde:

  • dt é a taxa de desemprego de determinado período
  • yt é o PIB do país
  • pt é a produtividade por trabalhador, medida por exemplo em unidades produzidas por trabalhador
  • st é o salário real do trabalhador, medido em reais brasileiros corrigidos pelo IPCA a preços do último período analisado
  • it é o percentual da população brasileira que está economicamente ativa em cada período
  • \epsilon_t é um componente aleatório idêntica e independentemente extraído de uma distribuição normal

Classificação das séries temporais[editar | editar código-fonte]

As séries temporais podem ser estacionárias ou não estacionárias (têm ou não raiz unitária). Além disso, podem ser estocásticas ou determinísticas6 .

Quando os valores da série podem ser escritos através de uma função matemática y = f(tempo) diz-se que a série é determinística. Quando a série envolve, além de uma função matemática do tempo, também um termo aleatório y = f(tempo,\varepsilon) a série é chamada estocástica. Normalmente as séries temporais são analisadas a partir de seus principais movimentos descritos como: tendência, ciclo, sazonalidade e variações aleatórias.

Série estacionária[editar | editar código-fonte]

Uma série estacionária é o que em matemática costuma se chamar série convergente, ou seja, aquela que flutua em torno de uma mesma média ao longo do tempo6 .

Para garantir que o componente estocástico também flutue ao redor de uma mesma média, assume-se, por exemplo que ele seja um componente aleatório idêntica e independentemente extraído de uma distribuição normal. Digamos:

\epsilon_t \sim N \left(0,\sigma^2 \right), ou seja, o componente aleatório provém de uma distribuição normal com média zero e variância finita.
Série temporal estacionária apenas com componente determinístico Série temporal estacionária com componente estocástico (contém \epsilon_t), com ou sem o componente determinístico
Exemplo teórico Exemplo 1: y_t = \mu, onde \mu é uma constante; Exemplo 2: y_t = \mu + b \cdot y_{t-1}, onde b é uma constante y_t = \mu + \epsilon_t, onde \mu é uma constante; \epsilon_t \sim N \left(0,\sigma^2 \right)
Exemplo com números Exemplo 1: y_t = 5; Exemplo 2: y_t = 2 + 0,5 \cdot y_{t-1} y_t = 5 + \epsilon_t; \epsilon_t \sim N \left(0,\sigma^2 \right)

Série não estacionária[editar | editar código-fonte]

A série não estacionária (ou divergente, em matemática), é aquela que tem raiz unitária.

Série temporal não estacionária apenas com componente determinístico Série temporal não estacionária com componente estocástico (contém \epsilon_t), com ou sem o componente determinístico
Exemplo teórico Exemplo 1: y_t = \mu + b \cdot t, onde \mu é uma constante e t é o período; Exemplo 2: y_t = \mu + c \cdot y_{t-1} + b \cdot t, onde b é uma constante y_t = \mu + b \cdot t+ \epsilon_t, onde b é uma constante
Exemplo com números Exemplo 1: y_t = 2 + 0,5 \cdot t; Exemplo 2: y_t = 1 + 0,1 \cdot y_{t-1} + 2 \cdot t y_t = 0,1 + 2 \cdot t+ \epsilon_t

Estudo de séries temporais[editar | editar código-fonte]

Existem duas formas de estudar séries temporais. Uma análise da série temporal é um método para tentar entender a série temporal, de forma a entender a estrutura que gerou a série. Uma previsão a partir da série temporal procura construir um modelo matemático a partir do qual seja possível prever valores futuros da série. Os modelos para estudar as séries temporais são muito conhecidos por seus acrônimos em inglês, montados a partir de AR (modelos auto-regressivos), 'I' (modelos integrados) e MA (modelos de média móvel). Por exemplo, o modelo ARIMA é um modelo auto-regressivo, integrado e de média móvel.

Especificidade das séries temporais em relação aos dados cross section[editar | editar código-fonte]

Ao contrário do que ocorre com os dados cross-section, os dados de uma série temporal geralmente são dependentes no tempo. Por exemplo, no caso de uma série do PIB anual do Brasil, pode-se imaginar facilmente que o PIB de determinado ano é muito parecido com o PIB do ano anterior. Se tomarmos, por outro lado, dados em cross section do PIB de diversos países no mesmo ano, não há nenhuma razão para crer, a priori, que o PIB de um dos países da amostra seja parecido com o PIB de outro país da amostra.

Em economia, a teoria de equações de diferenças subjaz todos os métodos de séries temporais empregadas. É justo dizer que a econometria de séries temporais está preocupada com a estimativa de equações a diferenças contendo componentes estocásticos7 .

Ver também[editar | editar código-fonte]

Referências[editar | editar código-fonte]

  1. a b c d WOOLDRIDGE, Jeffrey M. Introductory Econometrics: a Modern Approach. 2000, South-Western College Publishing, a division of Thomson Learning. ISBN 0-538-85013-2. Capítulo 1, Página 8
  2. ROYAL SWEDISH ACADEMY OF SCIENCES. Time-series Econometrics: Cointegration and Autoregressive Conditional Heteroskedasticity. Disponível em: <http://www-stat.wharton.upenn.edu/~steele/HoldingPen/NobelPrizeInfo.pdf>. Acesso em; 18 de setembro de 2011.
  3. a b c d IBGE. Componentes do Produto Interno Bruto sob as três óticas - 2004-2008. Disponível em: <http://www.ibge.gov.br/home/estatistica/economia/contasnacionais/2008/tabelas_pdf/tab04.pdf>. Acesso em: 17 de setembro de 2011.
  4. SHIKIDA, Pery Francisco Assis e MARGARIDO, Mario Antonio. Uma análise econométrica de sazonalidade dos preços da cana-de-açúcar, estado do Paraná, 2011-2007. In: Informações Econômicas, SP, v.39, n.2, fev. 2009. Disponível em: <ftp://ftp.sp.gov.br/ftpiea/publicacoes/IE/2009/tec7-0209.pdf>. Acesso em: 25 de agosto de 2012.
  5. CAMPOS,Ma. de Fátima S. de Souza e CAMPOS, Luís Henrique Romani. Evolução do Mercado de Trabalho no Brasil no período 1991-2000 e seus Reflexos sobre o Desemprego: Um Estudo Empírico. Disponível em: <http://www.sep.org.br/artigo/6_congresso_old/vicongresso38.pdf>. 2001?. Acesso em: 17 de setembro de 2011.
  6. a b BUENO, Rodrigo de Losso da Silveira. Econometria de Séries Temporais. São Paulo: Cengage Learning, 2008. 299 páginas. ISBN 978-85-221-0642-4
  7. ENDERS, Walter. Applied Econometric Time Series. Second Edition. Wiley series in probability and statistics. ISBN 0-471-23065-0.
Ícone de esboço Este artigo sobre matemática é um esboço. Você pode ajudar a Wikipédia expandindo-o.