Как получить доступ и управлять данными PDF-файла в Hadoop?

Я хочу прочитать файл PDF, используя hadoop, как это возможно? Я только знаю, что hadoop может обрабатывать только txt-файлы, так что есть ли возможность проанализировать PDF-файлы в txt.

Дайте мне предложение.

Ответы на вопрос(2)

Ваш ответ на вопрос