2014 será o ano do fim do SAS e do SPSS? Não exatamente!

Foi publicado no excelente blog r4stats um post sobre uma previsão do fim da utilização do SAS e do SPSS em meados de 2014, no qual o autor chega a essa conclusão através de uma análise de tendências na qual o estudo verificou que estas suítes vêm sofrendo declínio de utilização; e também ressalta com o crescimento da utilização do R como ferramenta estatística.

O ponto que o blog defende a sua previsão é que o R mesmo com os problemas aparentes de usabilidade (ausência de uma GUI, ou mesmo “validade” no mundo corporativo como uma ferramenta confiável) irá se tornar uma ferramenta que irá dominar o mercado.

Em mineração de dados, um dos conceitos fundamentais para qualquer projeto dessa natureza é que não adianta ser o famoso “samba de uma nota só”. O ponto principal é que a melhor ferramenta é aquela que resolve melhor o problema a ser estudado. Ponto.

Tanto o R quanto o SAS, e o SPSS tem o seu publico, e para quem estudou Economia da Informação, sabe de dois conceitos bem básicos que são o Vendor Locking e Base Instalada. A tendência geral é que de modo que a análise de dados aparece como uma peça de fator determinante em uma empresa, os analistas terão que ser mais “híbridos” (desculpem pela palavra-gatilho) e ter que aprender a trabalhar com o maior número possível de ferramentas dentro dos mais distintos cenários.

Ser fanboy de uma determinada ferramenta não somente limita o profissional de mineração de dados, mas também torna o analista totalmente dependente dessa tecnologia; e pior: isso leva pessoas inteligentes a adotarem posturas as quais não conseguem ver os principais defeitos do produto que estão utilizando. Pense pela segunte perspectiva: se o SAS e o SPSS são caros e são “engessados” como alguns alegam, o que dizer do R que por exemplo tem uma extrema dificuldade em conectar em bancos de dados relacionais, ou mesmo não “aguenta” um arquivo .txt com mais de 700 registros?

Com a evolução de segmentos da análise de dados, é natural que novas soluções venham a público e isso é ótimo, já que o analista de dados pode usar essa complexidade do ambiente como barganha seja em termos de tempo de projeto (curva de aprendizado e implementação) mas também como compensação salarial (já que terá um arsenal de armas muito maior que a média do merdado).