Cross Industry Standard Process for Data Mining

Origem: Wikipédia, a enciclopédia livre.
Ir para: navegação, pesquisa

CRISP-DM é a abreviação de CRoss Industry Standard Process for Data Mining1 , que pode ser traduzido como Processo Padrão Inter-Indústrias para Mineração de Dados. É um modelo de processo de mineração de dados que descreve abordagens comumente usadas por especialistas em mineração de dados para atacar problemas.

CRISP-DM 2.0[editar | editar código-fonte]

Em Julho de 2006 o consórcio responsável pela criação do processo anunciou que iria iniciar os trabalhos na direção da segunda versão do CRISP-DM. Em Setembro de 2006, o CRISP-DM SIG reuniu-se para discutir possíveis melhorias a serem implementadas no CRISP-DM 2.0, e traçar o curso do projeto.


Fases[editar | editar código-fonte]

  • Entender o Negócio: foca em entender o objetivo do projeto a partir

de uma perspectiva de negócios, definindo um plano preliminar para atingir os objetivos.

  • Entender os Dados: recolhimento de dados e inicio de atividades para

familiarização com os dados, identificando problemas ou conjuntos interessantes.

  • Preparação dos Dados: construção do conjunto de dados final a partir

dos dados iniciais. Normalmente ocorre várias vezes no processo.

  • Modelagem: várias técnicas de modelagem são aplicadas, e seus

parâmetros calibrados para otimização. Assim, é comum retornar à Preparação dos Dados durante essa fase.

  • Avaliação: é construído um modelo que parece ter grande qualidade

de uma perspectiva de análise de dados. No entanto, é necessário verificar se o modelo atinge os objetivos do negócio.

  • Desenvolvimento: o conhecimento adquirido pelo modelo é

organizado e apresentado de uma maneira que o cliente possa utilizar.

Vantagens[editar | editar código-fonte]

  • Independente de Indústria - O mesmo processo pode ser aplicado ao analisar dados comerciais, financeiros, de recursos humanos, produção industrial, serviços prestados, etc.
  • Independente de Ferramenta;
  • Tem relação próxima com os modelos de procesos de KDD

Referências

  1. Shearer C. The CRISP-DM model: the new blueprint for data mining. J Data Warehousing 2000;5:13—22.

Ligações externas[editar | editar código-fonte]

Ícone de esboço Este artigo sobre Informática é um esboço. Você pode ajudar a Wikipédia expandindo-o.