Grandes conjuntos de datos públicos? [cerrado]

Estoy buscando algunos grandes conjuntos de datos públicos, en particular:

Grandes registros de servidores web de muestra que han sido anonimizados.

Conjuntos de datos utilizados para la evaluación comparativa del rendimiento de la base de datos.

Cualquier otro enlace a grandes conjuntos de datos públicos sería apreciado. Ya conozco los conjuntos de datos públicos de Amazon en:http://aws.amazon.com/publicdatasets/