Diferença entre Data Mining (Mineração de Dados) e Machine Learning (Aprendizado de Máquina)
2015 Jan 06Neste post do ARE os autores fazem uma tabela que se não representa 100% do que são essas duas disciplinas tão interligadas, ajuda ao menos colocar um pouco de luz na discussão.
Parâmetro
Data Mining (Mineração de Dados)
Machine Learning (Aprendizado de Máquina)
Definição
Processo de extração de informação de um conjunto de dados e transformação de uma estrutura entendível para posterior uso.
Tem como objetivo a construção e estudo de sistemas que podem aprender com os dados.
Foco
Tem o foco na descoberta de propriedades desconhecidas dos nos dados.
Tem foco na predição, baseado em características conhecidas e aprendidas pelos dados de treinamento.
Tamanho da Base de Dados
É um processo automático ou semi-automático para performar em bases com grandes quantidades de dados.
É geralmente performada em bases de dados pequenas para o aumento da acurácia.
Tipos
Regras de Associação, Classificação, Clustering (Agrupamento), Padrões Sequenciais, Sequência de Similaridade
Supervisionado, Não-Supervisionado, Reforço
Relacionamento
A Mineração de Dados usa diversas técnicas provenientes de Aprendizado de Máquina, mas com objetivos distintos.
O Aprendizado de Máquina também usa técnicas de mineração de dados como “Aprendizado Não-Supervisonado” ou como “Passo de Pré-Processamento” para melhoria do modelo de aprendizado.
Aplicações
Previsão, Classificação, Associação, Clustering (Agrupamento), Geração de Sequências
Automação de Controle de Acesso de Funcionários, Proteção da Fauna, Predição de tempo de espera em salas de emergência, Identificação de falha cardíaca
Exemplos de Softwares
Carrot2, GATE, UIMA, Weka, NLTK, Torch etc.
Apache Mahout ,ELKI, H2O, OpenCV, OpenNN, Weka, MATLAB etc.