Variáveis, Granularidade e Data Model

No momento do levantamento do Data Model é importante ter em mente quais variáveis devem ser utilizadas, e principalmente qual a sua relevância para as análises que serão realizadas, seja em um DW ou mesmo quando se extraí dados de um OLTP.

Esse post do Dean Abbott é bastante interessante para avaliar quais variáveis que devem ser mapeadas para a análise em mineração de dados e a sua importância.

O Data Model é um passo quase que crucial para determinar se haverá uma boa Análise/DW ou não. Simples assim.

Quem trabalha com arquitetura de DW e ou análise de dados em mineração de dados sabe a importância disso, tanto que não é por acaso que o Bill Innon dedica quase um compêndio inteiro de informações no seu livro Building the Data Warehouse sobre granularidade e a sua importância; e mostra os dois lados que são a) que a falta de uma boa granularidade pode matar a análise e tornar o seu DW uma favelinha (com criação de tabelas auxiliares, coluninhas inofensivas, entre outros) ou b) mesmo tornar o DW um monstro sedento por dados que nunca serão acessados, e gerando transtornos em processamento, e performance de consulta em geral.