5 · MAY · 2012

Variáveis, Granularidade e Data Model

FLAVIO CLESIO · 4 min

No momento do levantamento do Data Model é importante ter em mente quais variáveis devem ser utilizadas, e principalmente qual a sua relevância para as análises que serão realizadas, seja em um DW ou mesmo quando se extrai dados de um OLTP.

Esse post do Dean Abbott é bastante interessante para avaliar quais variáveis devem ser mapeadas para a análise em mineração de dados e a sua importância.

O Data Model é um passo quase crucial para determinar se haverá uma boa Análise/DW ou não. Simples assim.

Quem trabalha com arquitetura de DW e/ou análise de dados em mineração de dados sabe a importância disso, tanto que não é por acaso que o Bill Inmon dedica quase um compêndio inteiro de informações no seu livro Building the Data Warehouse sobre granularidade e a sua importância; e mostra os dois lados que são a) que a falta de uma boa granularidade pode matar a análise e tornar o seu DW uma favelinha (com criação de tabelas auxiliares, coluninhas inofensivas, entre outros) ou b) mesmo tornar o DW um monstro sedento por dados que nunca serão acessados, gerando transtornos em processamento e performance de consulta em geral.