Diferença entre Data Mining (Mineração de Dados) e Machine Learning (Aprendizado de Máquina)

Neste post do ARE os autores fazem uma tabela que se não representa 100% do que são essas duas disciplinas tão interligadas, ajuda ao menos colocar um pouco de luz na discussão.

Parâmetro

Data Mining (Mineração de Dados)

Machine Learning (Aprendizado de Máquina)

Definição

Processo de extração de informação de um conjunto de dados e transformação de uma estrutura entendível para posterior uso.

Tem como objetivo a construção e estudo de sistemas que podem aprender com os dados.

Foco

Tem o foco na descoberta de propriedades desconhecidas dos nos dados.

Tem foco na predição, baseado em características conhecidas e aprendidas pelos dados de treinamento.

Tamanho da Base de Dados

É um processo automático ou semi-automático para performar em bases com grandes quantidades de dados.

É geralmente performada em bases de dados pequenas para o aumento da acurácia.

Tipos

Regras de Associação, Classificação,  Clustering (Agrupamento), Padrões Sequenciais, Sequência de Similaridade

Supervisionado, Não-Supervisionado, Reforço

Relacionamento

A Mineração de Dados usa diversas técnicas provenientes de Aprendizado de Máquina, mas com objetivos distintos.

O Aprendizado de Máquina também usa técnicas de mineração de dados como “Aprendizado Não-Supervisonado” ou como “Passo de Pré-Processamento” para melhoria do modelo de aprendizado.

Aplicações

Previsão, Classificação, Associação, Clustering (Agrupamento), Geração de Sequências

Automação de Controle de Acesso de Funcionários, Proteção da Fauna, Predição de tempo de espera em salas de emergência, Identificação de falha cardíaca

Exemplos de Softwares

Carrot2, GATE, UIMA, Weka, NLTK, Torch etc.

Apache Mahout ,ELKI, H2O, OpenCV, OpenNN, Weka, MATLAB etc.