Как я могу получить список всех идентификаторов фильмов из Freebase?
Над проектом, над которым я работал пару лет назад, я собирал данные о фильмах из Freebase. Простой сценарий оболочки загрузил файл "film.tsv" (изhttp://download.freebase.com/datadumps/latest/browse/film/film.tsv). Затем я использовал поле «id» в этом файле для создания необходимых MQL-запросов для каждого из фильмов (извлечение других интересующих меня свойств, например, актеров, жанров).
Посмотрев сегодняшнее руководство разработчика, я понимаю, что Freebase продвинулась довольно неплохо, и заметно, что файл дампа, который я использовал ранее, больше не доступен. Я также вижу, что формат файла дампа теперь RDF, и из того, что я могу сказать, файлы дампа теперь доступны только как один архив 22 ГБ.
Если это вообще возможно, я бы хотел избегать загрузки файла 22G каждый раз, когда я хочу перестроить свой набор данных, чтобы можно было больше получать отдельные файлы дампа, например, как файл film.tsv?
Если нет, есть ли альтернативный способ получить полный список идентификаторов фильмов?