A Análise Data-Driven é uma falha Imaginativa

Este post do R Cereals mostra mais uma vez que a velha guerrinha entre machine learners e estatísticos vai continuar por um longo tempo devido a mais desconhecimento de cada uma das partes com o segmento do outro do que divergências técnicas conceituais.

Em suma o post trata de que o modelo de análise Data-Driven é uma falha imaginativa na qual (na visão do autor), qualquer análise que se chame de “ciência” deve haver uma hipótese.

Oras, se somente a hipótese for o motor da ciência então tudo o que nós mineradores de dados conhecemos como análise exploratória de dados não é ciência de fato?

Essa afirmação por sí só já é absurda.

Então quer dizer que a NASA (a instituição mais científica do mundo) manda a Mars Rover sedimentada apenas por uma hipótese? As viagens espaciais da Challenger e da Discovery foram somente baseadas em uma hipótese?

Certamente o autor nunca leu algum livro sobre KDD ou Mineração de Dados no qual em 80% tempo temos a citação de que o processo de descoberta de conhecimento é the “…non-trivial process of identifying valid, novel, potentially useful and ultimately understandable patterns in data…“.

É um assunto que ainda será pauta aqui do Mineração de Dados.