Извлечение текста из искаженного PDF [закрыт]

Question

Feb 17, 2017, 03:07 PM

Извлечение текста из искаженного PDF [закрыт]

У меня есть файл PDF с ценной текстовой информацией.

Проблема в том, что я не могу извлечь текст, все, что я получаю, это куча искаженных символов. То же самое происходит, если я копирую и вставляю текст из программы чтения PDF в текстовый файл. ЧетноеFile -> Save as text в Acrobat Reader не работает.

Я использовал все инструменты, которые мог достать, и результат тот же. Я считаю, что это как-то связано с встраиванием шрифтов, но я не знаю, что именно?

Мои вопросы:

What is the culprit of this weird text garbling? How to extract the text content from the PDF (programmatically, with a tool, manipulating the bits directly, etc.)? How to fix the PDF to not garble on copy?

Извлечение текста из искаженного PDF [закрыт]

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Извлечение текста из искаженного PDF [закрыт]

Ответы на вопрос(3)

Ваш ответ на вопрос

Популярные вопросы