Результаты поиска по запросу "apache-tika"
Как программно сравнить два PDF-файла на основе визуальных различий? [закрыто]
Мне нужно сравнить и получить все визуальные различия в двух файлах PDF. Я знаю, что есть некоторые вопросы, связанные с этим при переполнении стека, но они не удовлетворяют мою потребность. В настоящее время я использую PDFBox для генерации ...
невозможно настроить Tika1.2 с помощью solr4
Я пытаюсь использовать TikaEntityProcessor для индексации содержимого файла .html. Почему-то я не могу получить это правильно. Я проверил журнал ошибок и получил следующую ошибку. SEVERE: Full ...
Как индексировать текстовые файлы, используя apache solr
Я хотел индексировать текстовые файлы. После долгих поисков я узнал об Apache tika. Теперь на некоторых сайтах, где я изучал тика Apache, я узнал, что тика Apache преобразует текст в формат XML, а затем отправляет его в solr. Но ...
Чтение содержимого из файлов, которые находятся внутри Zip-файла
Я пытаюсь создать простую Java-программу, которая читает и извлекает содержимое из файла (-ов) внутри zip-файла. Zip-файл содержит 3 файла (txt, pdf, docx). Мне нужно прочитать содержимое всех этих файлов, и я используюАпач Тикадля этого. Может ...