As 8 piores técnicas de Predição em Mineração de Dados

Provavelmente esse é um dos posts que melhor retratam a questão de como é realizada a análise de dados em relação ao desenvolvimento de modelos de técnicas de mineração de dados e estatística aplicados à predição.

No artigo do Vincent Granville ele coloca de uma maneira bem pessoal, uma lista que ele considera as 8 piores técnicas de predição de mineração de dados, na qual ele faz a citação da técnica e coloca os famosos drawbacks.

Em especial a pergunta postada nos comentários faz muito sentido, e expõe a forma torta na qual tomamos decisões baseadas em dados:

Alternate question: how many billions of trillions of dollars have been lost over the last 10 years due to using faulty / inappropriate / poor / non-robust statistical models, or misusing / misinterpreting correct models (either on purpose, e.g. due to corruption, or because of incompetence).

Pergunta Alternativa: Quantos bilhões ou trilhões de dólares foram perdidos nos últimos 10 anos devido ao uso de defeituosos / inapropriados / pobres / modelos estatísticos sem robustez, ou mau uso / má interpretação de modelos corretos (ou de propósito, por exemplo, devido à corrupção, ou por causa de incompetência). (Tradução Livre)

Pode-se aceitar ou não a generalização do autor, entretanto, parece que são pontos interessantes para qualquer debate ou estudo sobre o tema, pois coloca contra-pontos razoáveis sobre as técnicas que os textbooks, vendedores de ferramentas, e praticantes de mineração de dados fazem questão de esconder.