Результаты поиска по запросу "pdf-parsing"

1 ответ

Разница между версиями iTextSharp 4.1.6 и 5.x

Мы разрабатываем анализатор Pdf для использования вместе с нашей системой. Требование таково, что мы храним всю информацию в любых документах PDF и должны им...

3 ответа

Извлечь таблицу из PDF

Я пытаюсь извлечь таблицу из PDFдокумент [http://www.nea.org.np/images/supportive_docs/55082070-3-19.pdf] Я попробовал маршрут pdf -> html -> извлечь таблицу. PDF-файл, который я упоминал выше при преобразовании в html, производит мусор, ...

1 ответ

Что это (cid: 51) в выводе pdf2txt?

Так что я'Я пытаюсь извлечь текст из PDF-файла, мне нужно его положение, ширина, высота, шрифт.Я пробовал много, но самое полезное и полное решение выгля...

ТОП публикаций

2 ответа

Разбор PDF-файлов в Hadoop Map Reduce

Я должен проанализировать PDF-файлы, которые находятся в HDFS, в программе уменьшения карты в Hadoop. Так что я получаю PDF файл из HDFS какВходные расщепления и он должен быть проанализирован и отправлен в Mapper Class. Для реализации этого ...

1 ответ

Что это (cid: 51) в выводе pdf2txt?

Поэтому я пытаюсь извлечь текст из файла PDF, мне нужно его положение, ширина, высота, шрифт. Я пробовал много, но самое полезное и полное решение выглядитPDFMiner [http://www.unixuser.org/~euske/python/pdfminer/]и в этом случае, ...

3 ответа

Извлечь таблицу из PDF

6 ответов

Ruby: чтение файлов PDF

Я ищу быстрый и надежный способ чтения / анализа больших файлов PDF в Ruby (в Linux и OSX). До сих пор я нашел довольно старый и ...