Извлечение текста из файла PDF с использованием PDFMiner в Python?
Python версия 2.7
Я ищу документациюили же примеры того, как извлечь текст из файла PDF, используя PDFMiner с Python.
Похоже, что PDFMiner обновил свой API, и все соответствующие примеры, которые я нашел, содержат устаревший код (классы и методы изменились). Я обнаружил, что библиотеки, которые облегчают задачу извлечения текста из файла PDF, используют старый синтаксис PDFMiner, поэтому я не уверен, как это сделать.
На самом деле, я просто смотрю на исходный код, чтобы понять, смогу ли я это выяснить.