Búsqueda y descarga de imágenes en el volcado de Wikipedia

Estoy tratando de encontrar una lista completa de todas las imágenes en wikipedia, que luego puedo filtrar hasta las de dominio público. He descargado los volcados de SQL desde aquí:

http://dumps.wikimedia.org/enwiki/latest/

Y estudió el esquema DB:

http://upload.wikimedia.org/wikipedia/commons/thumb/4/42/MediaWiki_1.20_%2844edaa2%29_database_schema.svg/2193px-MediaWiki_1.20_%2844edaa2%29_database_schema.svg.png

Creo que lo entiendo, pero cuando tomo una imagen de muestra de una página de wikipedia no puedo encontrarla en ningún sitio en los vertederos. Por ejemplo:

http://en.wikipedia.org/wiki/File:Carrizo_2a.JPG

He hecho un grep en la 'imagen' de los volcados, 'enlaces de imagen' y 'página' buscando 'Carrizo_2a.JPG' y no se ha encontrado.

¿Estos vertederos no están completos? ¿Estoy malinterpretando la estructura? ¿Hay una mejor manera de hacer esto?

Además, para avanzar un paso: después de haber filtrado mi lista y quiero descargar un conjunto de imágenes (miles), vi algunas menciones que debo hacer desde un espejo del sitio para evitar la sobrecarga de wikipedia / wikimedia . Si tiene alguna orientación sobre esto también, sería útil.

Respuestas a la pregunta(1)

Su respuesta a la pregunta