Passos para a criação de um projeto de Modelagem Preditiva

Neste post da Salford Systems tem um guia com nove fases: 1) Entendimento do negócio (especificação e um objetivo) 2) Inventário de dados e entendimento 3) Avaliação de dados para adequação nas técnicas 4) Projeto Piloto 5) Preparação (e exploração) dos dados 6) Modelagem (construção de modelos preditivos) 7) Avaliação, Interpretação, Entendimento 8) Projeto Completo 9) Implantação

Amostragem: Precisamos mesmo de 3 divisões amostrais (treinamento, validação e teste)?

Neste artigo do Dan Steinberg ele responde de forma clara: “The short answer to this question is “no” we do not think that the 3-way partition is mandatory for SPM core models such as CART and TreeNet.” Confesso que fiquei assustado com a resposta, mas abaixo no próprio artigo ele coloca a justificativa: “The question we address here is whether this is really enough when the process of model development is lengthy and may involve the building of dozens, hundreds, or even thousands of models.