Dataset Gigante para Análise de Tráfego Web

Para quem estiver procurando uma base sobre análise de tráfego na web, esse projeto é o que há de mais recente neste ramo. Com um pouco mais de 53 BILHÕES de registros e com o arquivo comprimido de aproximadamente 2.3 TERABYTES deve ser um ótimo recurso para esse tipo de análise.

Direto da página do projeto as seguintes considerações:

Web Traffic Analysis & Modeling

To foster the study of the structure and dynamics of Web traffic networks, we make available a large dataset (‘Click  Dataset’) of about 53.5 billion HTTP requests made by users at Indiana University. Gathering anonymized requests directly from the network rather than relying on server logs and browser instrumentation allows one to examine large volumes of traffic data while minimizing biases associated with other data sources