Usuário(a):Avertere/Testes

Origem: Wikipédia, a enciclopédia livre.

Cadeias estocásticas com memória de alcance variável constituem uma família de cadeias estocásticas de ordem finita em um alfabeto finito. A ideia é que, para cada passado, apenas um sufixo finito do passado, chamado contexto, é suficiente para predizer o próximo símbolo. Esses modelos foram introduzidos na literatura da teoria da informação por Jorma Rissanen, em 1983,[1] como uma ferramenta universal para a compressão de dados. Recentemente, elas têm sido usadas para modelar dados em diferente áreas, como biologia,[2] linguística,[3] e música [4].

Definicão[editar | editar código-fonte]

Uma cadeia com memória de alcance variável é uma cadeia estocástica , tomando valores em um alfabeto finito e caracterizada por dois elementos.

  1. O conjunto de todos os contextos. Um contexto é uma porção finita do passado que é relevante para predizer o próximo símbolo
  2. Uma família de probabilidade de transição associada a cada contexto.

História[editar | editar código-fonte]

A classe das cadeias estocásticas com memória de alcance variável foi introduzida em 1983 por Jorma Rissanen, no artigo A universal system for data compression system.[1] Essa classe de cadeias estocásticas foi popularizada na comunidade estatística e probabilística por P. Bühlmann e A. J. Wyner, em 1999, no artigo Variable Length Markov Chains. Chamadas por Bühlmann e Wyner de “cadeias de Markov de alcance variável" (em inglês, VLMC, sigla de "Variable length Markov chains"), essas cadeias também são conhecidas por "Modelos de Markov de ordem variável" (em inglês, VOM, da sigla de "Variable order Markov Models"), “Árvores probabilísticas de sufixos”, por Bejerano; “Modelos gerados por árvores de contexto”[5] (Em inglês, “Context tree models”`). A designação “Cadeias estocásticas com memória de alcance variável” parece ter sido introduzida por Galves e Löcherbach, em 2008, no artigo Stochastic chains with memory of variable length [6].

Exemplos[editar | editar código-fonte]

A Valsa[editar | editar código-fonte]

O Samba[editar | editar código-fonte]

Fonte de Luz Interrompida[editar | editar código-fonte]

Propriedades probabilísticas[editar | editar código-fonte]

Existência[editar | editar código-fonte]

Simulação perfeita[editar | editar código-fonte]

Inferência em cadeias com memória de alcance variável[editar | editar código-fonte]

Dada uma amostra , como encontrar a árvore de contexto adequada? Os principais algoritmos já formulados para a solução desse problema são apresentados a seguir.

O algoritmo contexto[editar | editar código-fonte]

Bayesian information criterion[editar | editar código-fonte]

Smallest maximizer criterion[editar | editar código-fonte]

Referências[editar | editar código-fonte]

  1. a b Rissanen, J (Sep 1983). «A Universal Data Compression System». IEEE Transactions on Information Theory. 29 (5): 656–664. doi:10.1109/TIT.1983.1056741  Verifique data em: |data= (ajuda) Erro de citação: Código <ref> inválido; o nome "Rissanen" é definido mais de uma vez com conteúdos diferentes
  2. Bejenaro, G (2001). «Variations on probabilistic suffix trees: statistical modeling and prediction of protein families». Bioinformatics. 17 (5): 23-43. doi:10.1093/bioinformatics/17.1.23 
  3. Galves, A; Galves, C; García, J; Garcia, N L; Leonardi, F (2012). «Context tree selection and linguistic rhythm retrieval from written texts». The Annals of Applied Statistics. 6 (5): 186-209. doi:10.1214/11-AOAS511 
  4. Dubnov, S; Assayag, G; Lartillot, O; Bejenaro G (2003). «Using machine-learning methods for musical style modeling». Computer. 36 (10): 73-80. doi:10.1109/MC.2003.1236474 
  5. Galves, A; Garivier, A; Gassiat, E (2012). «Joint estimation of intersecting context tree models». Scandinavian Journal of Statistics. 40 (2): 344-362. doi:10.1111/j.1467-9469.2012.00814.x 
  6. Galves, A; Löcherbach, E (2008). «Stochastic chains with memory of variable length» (PDF). TICSP Series. 38: 117-133