Resenha: Discovering Knowledge in Data: An Introduction to Data Mining
2012 Nov 28Este livro é o primeiro de uma série de livros editados e publicados por Daniel Larose. O livro mostra de maneira bem didática os passos que todo projeto de mineração de dados deve ter; no qual coloca de maneira acertada um resumo da metodologia CRISP-DM e também estudos de caso fundamentados no CRISP-DM. O autor também trata de análise exploratória de dados, e como já de costume de seus livros adota a abordagem estatística na mineração de dados, o qual prove como resultado um livro que não adota qualquer tipo de técnica do tipo caixa preta; o que pode auxiliar os iniciantes e intermediários em mineração de dados. As técnicas abordadas no livro são Vizinho mais Próximo, árvore de decisão, redes neurais, agrupamento k-means, Kohonen SOM, e regras de associação. Essas técnicas são muito bem descritas e conta com ensinamentos passo a passo pelo autor; e ao final do livro são apresentadas algumas técnicas de avaliação de modelos, o qual conta com um background estatístico bem relevante. De maneira geral o livro é muito bem escrito e se diferencia na literatura por ter uma abordagem bem write-box (caixa branca) no qual além de apresentar as técnicas de uma forma bem transparente; o que facilita o aprendizado e principalmente o entendimento, este último não tão bem apresentado em outras obras do gênero. Pontos Positivos: Simplicidade na abordagem, leitura sucinta, coesão do texto como todo dentro de uma abordagem introdutória. Pontos Negativos: Poderia falar um pouco mais da abordagem de aprendizado de máquina e a influência na mineração de dados, e o formato textbook não pode agradar a muitos.