Извлечение текста из PDF с помощью Poppler (C ++)
Я пытаюсь разобраться с Попплером и его (отсутствием) документации.
Я хочу сделать очень простую вещь: открыть файл PDF и прочитать текст в нем. Затем я собираюсь обработать текст, но здесь это не имеет значения.
Итак ... я виделpoppler_page_get_text
функция, и это отчасти работает, но я должен указать прямоугольник выбора, что не очень удобно. Разве не существует очень простой функции, которая выводила бы текст PDF по порядку (может, построчно?).