Resenha: Data Mining with R: Learning with Case Studies

  Este livro de Luiz Torgo é um ótimo exemplo de que se podem escrever bons livros de mineração de dados, sem a forma prolixa dos livros que estão no mercado atualmente, no qual o autor ao mesmo tempo que trata da mineração de dados na ferramenta R, coloca exemplos bem práticos os quais podem ser transpostos para situações corporativas e educacionais com extrema facilidade.

Análise de Outliers: Teorema de Chebyschev X Abordagem Baseada e Informação Mútua

Nesse artigo de Cristian Mesiano é realizada a comparação entre o Teorema de Chebyschev e a abordagem baseada em Informação Mútua na questão da detecção de outliers, na qual, o Teorema de Chebyshev é baseado na distância de valores Z-Score de acordo com o Desvio Padrão do valor K, e a Informação Mútua remove interativamente os Z-Scores de forma ordenada até que a informação entre os Z-Scores e os candidatos a outliers aumente; e dessa forma a cada passo interativo do algoritmo o candidato a outliers tem o maior valor absoluto no dataset.