Как я могу получить список всех идентификаторов фильмов из Freebase?
Над проектом, над которым я работал пару лет назад, я собирал данные о фильмах из Freebase. Простой скрипт оболочки скачалfilm.tsv» файл (изhttp://download.freebase.com/datadumps/latest/browse/film/film.tsv). Я тогда использовалЯ бы" поле в этом файле для создания необходимых MQL-запросов для каждого из фильмов (получение других интересующих меня свойств, например, актеров, жанров).
Посмотрев на разработчикаПутеводитель по сегодняшнему дню Я понимаю, что Freebase продвинулась достаточно далеко, и значительно вижу, что использованный ранее дамп-файл больше не доступен. Я также вижу, что формат файла дампа теперь RDF, и из того, что я могу сказать, файлы дампа теперь доступны только как один архив 22 ГБ.
Если это вообще возможно, я бы хотел избегать загрузки файла 22G каждый раз, когда я хочу перестроить свой набор данных, чтобы можно было больше получать отдельные файлы дампа, например, как файл film.tsv?
Если нет, есть ли альтернативный способ получить полный список идентификаторов фильмов?