Visualização de Dados: Incerteza, e Ambigüidade

Neste artigo da Nature escrito por Vivien Marx ela traça bons paralelos com a atividade de visualização de dados e as incertezas e ambiguidades dessa forma de análise de dados.

A visualização de dados tornou-se uma disciplina muito estudada em especial nos últimos 20 anos, com especial destaque para os trabalhos do Edward Tufte. Entretanto um dos fatos que é pouco salientado até mesmo no estudo desta disciplina é que a visualização de dados obrigatoriamente implica na perda de informação. Ponto.

Essa perda refere-se a questões ligadas a modelagem gráfica na qual o analista de dados deve por obrigação realizar a abstração de dados para posteriormente enquadrar os mesmos em um formato orientado à visualização destes dados.

Não há nada de errado nisso, mas como a Sra. Marx coloca em ser artigo, nunca deve ser esquecido que:

“Being sure is good; being uncertain is not necessarily bad.”

Um dos pontos interessantes do artigo é sem dúvidas no aspecto da incerteza nos modelos de visualização de dados no qual a passagem abaixo representa muito bem isso:

“Uncertainty comes in many flavors. It can arise upon data capture, during analysis or during visualization. It may be due to missing, noisy or imprecise data or to filters that could skew calculations, or there may be too few data to begin with, says Heidrun Schumann, a computer scientist at the University of Rostock who studies uncertainty visualization in many research areas, including the life sciences”

O ponto principal do artigo e que pode servir para analistas de dados é que muitas das vezes um modelo de visualização mesmo com as suas abstrações de dados e com o seu grau de incerteza pode auxiliar na tomada de decisão por dois aspectos básicos que são 1) o tempo disponível para a análise dos dados e 2) forma de abstração e agregação da informação relevante que neste caso assume-se a incerteza e os riscos atrelados nela.

nmeth.2530