Metodologia de Projetos de Mineração de Dados - Cross Industry Standard Process for Data Mining - CRISP-DM

O Cross Industry Standard Process for Data Mining (CRISP-DM) é uma metodologia específica para aplicação em projetos de mineração de dados. Muitas informações sobre a metodologia pode ser encontrada aqui.

De uma maneira bem ampla, os projetos de mineração de dados têm especificidades que reúnem diversos tipos de disciplinas e expertises as quais com uma metodologia própria auxiliam não somente em questões de documentação, como esta última serve como um roteiro para projetos dessa natureza.

PMI, Agile, RUP, e demais metodologias de software e projetos genéricas são boas para SOFTWARE e não ara projetos que envolvem análise de dados propriamente dita, no qual não há requerimentos de complexidade arbitrária; mas sim há extração de informação e conhecimento de forma muito mais determinística, porém com um grau de precisão e validação muito maior; e é ai que CRISP-DM se destaca dos demais, pois ele vem para atender uma demanda muito mais específica dentro do seu ciclo de vida do que qualquer metodologia de software adaptada.

Esses dois documentos nos links abaixo, são os documentos da versão 1.0 do CRISP-DM os quais são padrões de melhores práticas compiladas por profissionais da indústria. A versão 2.0 está em processo de avaliação, devido ao fato de que muitos dos profissionais envolvidos na época estão em outras atividades em suas empresas que não mineração de dados propriamente dita.

crisp-dm 1.0 CRISP-DM No Brand CRISP-DM