Data stream mining

Origem: Wikipédia, a enciclopédia livre.
Saltar para a navegação Saltar para a pesquisa

Data Stream Mining é o processo de extrair estruturas de conhecimento de registros de dados rápidos e contínuos. Uma data stream é uma sequência ordenada de instâncias que, em muitas aplicações de data stream mining, pode ser lida apenas uma vez ou poucas vezes, usando recursos limitados de computação e armazenamento.

Em muitas aplicações de data stream mining, seu objetivo é prever a classe ou valor das novas instâncias da data stream dado um conhecimento sobre membros de classe e valores anteriores da data stream. As técnicas de machine learning podem ser utilizadas para a previsão de tarefas a partir de exemplos de rotulados de forma automatizada. Muitas vezes, os conceitos do campo da aprendizagem incrementais para lidar com alterações estruturais, aprendizado on-line e demandas em tempo real. Em muitas aplicações, especialmente de operação não estacionárias, uma distribuição subjacente pode ser usada como uma regra para a sua rotulagem, mudando ao longo do tempo. Este problema é conhecido como conceito de deriva.

Exemplos de data streams incluem o computador de tráfego de rede, conversas por telefone, transações em ATM, pesquisas na web e dados de sensor. Data stream mining pode ser considerada um subcampo de data mining, machine learning, e descoberta de conhecimento.

Software de data stream mining[editar | editar código-fonte]

  • MOA (Online Massivo e Análise): free open-source software específico para a mining data streams com o conceito de deriva. Ele possui diversos algoritmos de aprendizado (classificação, regressão, clustering, detecção de anexos e recommender systems). Também contém um prequential método de avaliação, o EDDM conceito deriva de métodos, um leitor de ARFF real conjuntos de dados, e artificial fluxo de geradores, como o SEA conceitos, STAGGER, girando hiperplano, árvore aleatória e aleatória radius baseado em funções. MOA suporte bi-direcional interação com Weka(machine_learning).
  • RapidMiner: sofware comercial para descoberta de conhecimento, data mining e machine learning também com data stream mining, a aprendizagem de diferentes conceitos e o conceito de acompanhamento à deriva (se utilizado em combinação com o seu data stream mining de plugin (anteriormente:plugin do Conceito Deriva))

Eventos[editar | editar código-fonte]

Veja também[editar | editar código-fonte]

Livros[editar | editar código-fonte]

Referências[editar | editar código-fonte]