Data stream mining: diferenças entre revisões

Origem: Wikipédia, a enciclopédia livre.
Conteúdo apagado Conteúdo adicionado
Aleth Bot (discussão | contribs)
m Bot: Substituição automática de afluentes - solicitado em Usuária:Aleth Bot/Substituição de afluentes
Ijgsantos (discussão | contribs)
Adicionando Referencias e conectores aos assuntos citados no verbete
 
Linha 1: Linha 1:
'''Data Stream Mining''' é o processo de extrair estruturas de conhecimento de registros de dados rápidos e contínuos. Uma data stream é uma sequência ordenada de instâncias que, em muitas aplicações de data stream mining, pode ser lida apenas uma vez ou poucas vezes, usando recursos limitados de computação e armazenamento.
'''Data Stream Mining''' é o processo de extrair estruturas de conhecimento de registros de dados rápidos e contínuos. Uma data stream é uma sequência ordenada de instâncias que, em muitas aplicações de data stream mining, pode ser lida apenas uma vez ou poucas vezes, usando recursos limitados de [[computação]] e [[armazenamento]].<ref>{{Citar periódico |url=https://doi.org/10.1145/1083784.1083789 |titulo=Mining data streams: a review |data=2005-06-01 |acessodata=2021-08-19 |jornal=ACM SIGMOD Record |número=2 |ultimo=Gaber |primeiro=Mohamed Medhat |ultimo2=Zaslavsky |primeiro2=Arkady |paginas=18–26 |doi=10.1145/1083784.1083789 |issn=0163-5808 |ultimo3=Krishnaswamy |primeiro3=Shonali}}</ref>


Em muitas aplicações de data stream mining, seu objetivo é prever a classe ou valor das novas instâncias da data stream dado um conhecimento sobre membros de classe e valores anteriores da data stream. As técnicas de machine learning podem ser utilizadas para a previsão de tarefas a partir de exemplos de rotulados de forma automatizada. Muitas vezes, os conceitos do campo da [[Aprendizagem|aprendizagem incrementais]] para lidar com alterações estruturais, [[Aprendizado|aprendizado on-line]] e demandas em tempo real. Em muitas aplicações, especialmente de operação não estacionárias, uma distribuição subjacente pode ser usada como uma regra para a sua rotulagem, mudando ao longo do tempo. Este problema é conhecido como [[Conceito|conceito de deriva]].
Em muitas aplicações de data stream mining, seu objetivo é prever a classe ou valor das novas instâncias da data stream dado um conhecimento sobre membros de classe e valores anteriores da data stream. As técnicas de [[Aprendizado de máquina|machine learning]] podem ser utilizadas para a previsão de tarefas a partir de exemplos de rotulados de forma automatizada. Muitas vezes, os conceitos do campo da [[Aprendizagem|aprendizagem incrementais]] para lidar com alterações estruturais, [[Aprendizado|aprendizado on-line]] e demandas em [[tempo real]]. Em muitas aplicações, especialmente de operação não estacionárias, uma distribuição subjacente pode ser usada como uma regra para a sua rotulagem, mudando ao longo do tempo. Este problema é conhecido como [[Conceito|conceito de deriva]].<ref>{{Citar periódico |url=https://doi.org/10.1145/543613.543615 |titulo=Models and issues in data stream systems |data=2002-06-03 |acessodata=2021-08-18 |publicado=Association for Computing Machinery |ultimo=Babcock |primeiro=Brian |ultimo2=Babu |primeiro2=Shivnath |series=PODS '02 |local=Madison, Wisconsin |paginas=1–16 |doi=10.1145/543613.543615 |isbn=978-1-58113-507-7 |ultimo3=Datar |primeiro3=Mayur |ultimo4=Motwani |primeiro4=Rajeev |ultimo5=Widom |primeiro5=Jennifer}}</ref><ref>{{Citar periódico |url=https://link.springer.com/chapter/10.1007/978-3-319-17551-5_4 |titulo=A Survey on Supervised Classification on Data Streams |data=2014-07-06 |acessodata=2021-08-19 |publicado=Springer, Cham |ultimo=Lemaire |primeiro=Vincent |ultimo2=Salperwyck |primeiro2=Christophe |paginas=88–125 |lingua=en |doi=10.1007/978-3-319-17551-5_4 |ultimo3=Bondu |primeiro3=Alexis}}</ref>


Exemplos de data streams incluem o computador de tráfego de rede, conversas por telefone, transações em ATM, pesquisas na web e dados de sensor.
Exemplos de data streams incluem o computador de tráfego de rede, conversas por [[telefone]], transações em [[ATM]], pesquisas na web e dados de sensor.
Data stream mining pode ser considerada um subcampo de [[:en:Data mining|data mining]], [[:en:Machine learning|machine learning]], e [[Extração de conhecimento|descoberta de conhecimento]].
Data stream mining pode ser considerada um subcampo de [[:en:Data mining|data mining]], [[Aprendizado de máquina|machine learning]], e [[Extração de conhecimento|descoberta de conhecimento]].<ref>{{Citar web |url=https://users.monash.edu/~mgaber/WResources.htm |titulo=Mining Data Streams Bibliography |acessodata=2021-08-19 |website=users.monash.edu}}</ref>


== Software de data stream mining ==
== Software de data stream mining ==


*[[MOA|MOA (Online Massivo e Análise)]]: free open-source software específico para a mining data streams com o conceito de deriva. Ele possui diversos algoritmos de aprendizado ([[Classificação estatística|classificação]], [[Regressão (estatística)|regressão]], [[clustering]], detecção de anexos e recommender systems). Também contém um prequential método de avaliação, o EDDM conceito deriva de métodos, um leitor de ARFF real conjuntos de dados, e artificial fluxo de geradores, como o SEA conceitos, STAGGER, girando hiperplano, árvore aleatória e aleatória radius baseado em funções. MOA suporte bi-direcional interação com [[Weka]][[:en:Weka (machine learning)|(machine_learning)]].
*[[MOA|MOA (Online Massivo e Análise)]]: [[Software Livre|free open-source software]] específico para a mining data streams com o conceito de deriva. Ele possui diversos algoritmos de aprendizado ([[Classificação estatística|classificação]], [[Regressão (estatística)|regressão]], [[clustering]], detecção de anexos e recommender systems). Também contém um prequential método de avaliação, o EDDM conceito deriva de métodos, um leitor de ARFF real [[Conjunto de dados|conjuntos de dados]], e artificial fluxo de geradores, como o SEA conceitos, STAGGER, girando hiperplano, árvore aleatória e aleatória radius baseado em funções. MOA suporte bi-direcional interação com [[Weka]][[Aprendizado de máquina|machine learning]].
*[[RapidShare|RapidMiner]]: sofware comercial para descoberta de conhecimento, data mining e machine learning também com data stream mining, a aprendizagem de diferentes conceitos e o conceito de acompanhamento à deriva (se utilizado em combinação com o seu data stream mining de plugin (anteriormente:plugin do Conceito Deriva))
*[[RapidShare|RapidMiner]]: [[Software comercial]] para descoberta de conhecimento, [[data mining]] e machine learning também com data stream mining, a aprendizagem de diferentes conceitos e o conceito de acompanhamento à deriva (se utilizado em combinação com o seu data stream mining de plugin (anteriormente:plugin do Conceito Deriva))


== Eventos ==
== Eventos ==
Linha 22: Linha 22:


*[[Conceito|Conceito de deriva]]
*[[Conceito|Conceito de deriva]]
* [[Mineração de dados|Mineração De Dados]]
*[[Mineração de dados|Mineração De Dados]]
*[[Sequência|Sequência de mineração]]
*[[Sequência|Sequência de mineração]]
*[[Streaming|Streaming Algoritmo]]
*[[Streaming|Streaming Algoritmo]]
* [[Stream processing|Processamento de fluxo de]]
*[[Stream processing|Processamento de fluxo de]]
* [[RSSF|Rede de sensores sem fio]]
*[[RSSF|Rede de sensores sem fio]]
*[[Lambda|Lambda arquitetura]]
*[[Lambda|Lambda arquitetura]]


Linha 37: Linha 37:
* {{Citar livro|url=https://www.springer.com/us/book/9781441980199|título=Learning in Non-Stationary Environments: Methods and Applications|data=2012|editor-sobrenome=Sayed-Mouchaweh|doi=10.1007/978-1-4419-8020-5|isbn=9781441980199|editor-sobrenome2=Lughofer}}
* {{Citar livro|url=https://www.springer.com/us/book/9781441980199|título=Learning in Non-Stationary Environments: Methods and Applications|data=2012|editor-sobrenome=Sayed-Mouchaweh|doi=10.1007/978-1-4419-8020-5|isbn=9781441980199|editor-sobrenome2=Lughofer}}


== Referências ==
{{Referências}}


* Mohamed Medhat Gaber, Arkady Zaslavsky, e Shonali Krishnaswamy, [https://dx.doi.org/10.1145/1083784.1083789 "Mineração de Sequências de Dados: Uma Revisão"], ''ACM SIGMOD Record'', Vol. 34, No. 2, junho de 2005, pp.&nbsp;18–26.
* Brian Babcock, Shivnath Babu, Mayur Datar, Rajeev Motwani, e Jennifer Widom, [https://dx.doi.org/10.1145/543613.543615 "Modelos e Problemas de Fluxo de Dados de Sistemas"], no ''Proc. 21 de ACM SIGACT-SIGMOD-SIGART Simpósio sobre Princípios de Sistemas de Banco de dados PODS (2002), Madison, Wisconsin, EUA'', junho de 2002.
* Classificação supervisionada em Fluxos de Dados - [https://rd.springer.com/chapter/10.1007/978-3-319-17551-5_4 "Um Inquérito sobre a Classificação Supervisionada em Fluxos de Dados"]
* [http://www.csse.monash.edu.au/~mgaber/WResources.htm Mineração De Sequências De Dados De Bibliografia]


[[Categoria:Inteligência empresarial]]
[[Categoria:Inteligência empresarial]]

Edição atual tal como às 05h09min de 19 de agosto de 2021

Data Stream Mining é o processo de extrair estruturas de conhecimento de registros de dados rápidos e contínuos. Uma data stream é uma sequência ordenada de instâncias que, em muitas aplicações de data stream mining, pode ser lida apenas uma vez ou poucas vezes, usando recursos limitados de computação e armazenamento.[1]

Em muitas aplicações de data stream mining, seu objetivo é prever a classe ou valor das novas instâncias da data stream dado um conhecimento sobre membros de classe e valores anteriores da data stream. As técnicas de machine learning podem ser utilizadas para a previsão de tarefas a partir de exemplos de rotulados de forma automatizada. Muitas vezes, os conceitos do campo da aprendizagem incrementais para lidar com alterações estruturais, aprendizado on-line e demandas em tempo real. Em muitas aplicações, especialmente de operação não estacionárias, uma distribuição subjacente pode ser usada como uma regra para a sua rotulagem, mudando ao longo do tempo. Este problema é conhecido como conceito de deriva.[2][3]

Exemplos de data streams incluem o computador de tráfego de rede, conversas por telefone, transações em ATM, pesquisas na web e dados de sensor. Data stream mining pode ser considerada um subcampo de data mining, machine learning, e descoberta de conhecimento.[4]

Software de data stream mining[editar | editar código-fonte]

  • MOA (Online Massivo e Análise): free open-source software específico para a mining data streams com o conceito de deriva. Ele possui diversos algoritmos de aprendizado (classificação, regressão, clustering, detecção de anexos e recommender systems). Também contém um prequential método de avaliação, o EDDM conceito deriva de métodos, um leitor de ARFF real conjuntos de dados, e artificial fluxo de geradores, como o SEA conceitos, STAGGER, girando hiperplano, árvore aleatória e aleatória radius baseado em funções. MOA suporte bi-direcional interação com Wekamachine learning.
  • RapidMiner: Software comercial para descoberta de conhecimento, data mining e machine learning também com data stream mining, a aprendizagem de diferentes conceitos e o conceito de acompanhamento à deriva (se utilizado em combinação com o seu data stream mining de plugin (anteriormente:plugin do Conceito Deriva))

Eventos[editar | editar código-fonte]

Ver também[editar | editar código-fonte]

Livros[editar | editar código-fonte]

Referências

  1. Gaber, Mohamed Medhat; Zaslavsky, Arkady; Krishnaswamy, Shonali (1 de junho de 2005). «Mining data streams: a review». ACM SIGMOD Record (2): 18–26. ISSN 0163-5808. doi:10.1145/1083784.1083789. Consultado em 19 de agosto de 2021 
  2. Babcock, Brian; Babu, Shivnath; Datar, Mayur; Motwani, Rajeev; Widom, Jennifer (3 de junho de 2002). «Models and issues in data stream systems». Madison, Wisconsin: Association for Computing Machinery. PODS '02: 1–16. ISBN 978-1-58113-507-7. doi:10.1145/543613.543615. Consultado em 18 de agosto de 2021 
  3. Lemaire, Vincent; Salperwyck, Christophe; Bondu, Alexis (6 de julho de 2014). «A Survey on Supervised Classification on Data Streams». Springer, Cham (em inglês): 88–125. doi:10.1007/978-3-319-17551-5_4. Consultado em 19 de agosto de 2021 
  4. «Mining Data Streams Bibliography». users.monash.edu. Consultado em 19 de agosto de 2021