Индексирование дампа Википедии с помощью Solr
На моей машине установлен solr 3.6.2, отлично работающий с tomcat. Я хочу проиндексировать файл дампа Википедии с помощью Solr. Как мне сделать это с помощью DataImportHandler? Любым другим путем? Я нене имею никаких знаний о XML.
Файл, о котором я упоминал, имеет размер около 45 ГБ при извлечении. Любая помощь будет принята с благодарностью.
Обновление - я пытался делать то, что сказано на странице DataImportHandler. Но есть некоторая ошибка, возможно, потому что их версия solr намного старше.
Мои data.config-
Схема (я только что добавил части, которые они дали на сайте, в мой файл schema.xml)
Я получаю ошибку -
0
0
solr-data-config.xml
full-import
idle
0:0:1.381
0
0
0
0
Indexing failed. Rolled back all changes.
2013-05-17 16:48:32
This response format is experimental. It is likely to change in the future.
пожалуйста помоги