Результаты поиска по запросу "apache-tika"

4 ответа

Как создать собственную модель с использованием OpenNLP?

я пытаюсьизвлекать сущностилюбитьИмена, Навыкииз документа с использованием OpenNLP Java API, ноэто не извлечение собственных имен, Я использую модель, доступную наopennlp ссылка на sourceforge [http://opennlp.sourceforge.net/models-1.5/] Вот ...

2 ответа

Проблема развертывания Tika-Parsers на Wildfly

В рамках веб-приложения мне нужно проанализировать текстовое содержимое различных входящих файлов. Это должно быть довольно просто, используяTIKA-парсеры, но...

1 ответ

как я могу определить фарси веб-страниц по Тика?

Мне нужен пример кода, который поможет мне обнаружить веб-страницы на фарси с помощью Apache Tika Toolkit. LanguageIdentifier identifier = new LanguageIdentifier("فارسی"); String language = identifier.getLanguage();Я скачал файлы jar apache.tika ...

ТОП публикаций

4 ответа

Как разобрать HTML с Nutch и индексировать определенный тег для Solr?

3 ответа

невозможно настроить Tika1.2 с помощью solr4

Я пытаюсь использовать TikaEntityProcessor для индексации содержимого файла .html. Почему-то я не могу получить это правильно. Я проверил журнал ошибок и получил следующую ошибку. SEVERE: Full ...

3 ответа

невозможно настроить Tika1.2 с помощью solr4

Я пытаюсь использовать TikaEntityProcessor для индексации содержимого файла .html. Почему-то я не могу получить это правильно. Я проверил журнал ошибок и пол...

4 ответа

Как разобрать HTML с Nutch и индексировать определенный тег для Solr?

2 ответа

Как индексировать текстовые файлы, используя apache solr

Я хотел индексировать текстовые файлы. После долгих поисков я узнал об Apache tika. Теперь на некоторых сайтах, где я изучал тика Apache, я узнал, что тика Apache преобразует текст в формат XML, а затем отправляет его в solr. Но ...

2 ответа

Как индексировать текстовые файлы, используя apache solr

Я хотел индексировать текстовые файлы. После долгих поисков я узнал об Apache tika. Теперь на некоторых сайтах, где я изучал тика Apache, я узнал, что тика A...

5 ответов

Это может помочь.

кто-нибудь указать мне на учебник. Мой основной опыт работы с Solr - индексирование файлов CSV. Но я не могу найти какие-либо простые инструкции / учебник, чтобы сказать мне, что мне нужно сделать, чтобы индексировать PDF-файлы. Я видел ...