Grandes conjuntos de dados públicos? [fechadas]

Estou procurando alguns grandes conjuntos de dados públicos, em particular:

Amostra grande de logs do servidor da web que foram anonimizados.

Conjuntos de dados usados para benchmarking de desempenho do banco de dados.

Quaisquer outros links para grandes conjuntos de dados públicos seriam apreciados. Eu já sei sobre os conjuntos de dados públicos da Amazon em:http://aws.amazon.com/publicdatasets/