Resultados da pesquisa a pedido "pdfminer"
Como uso o pdfminer como uma biblioteca
Estou tentando obter dados de texto de um pdf usando pdfminer [http://www.unixuser.org/~euske/python/pdfminer/index.html]. Consigo extrair esses dados para um arquivo .txt com êxito com a ferramenta de linha de comando pdfminer pdf2txt.py. ...
Extraindo tabelas de um pdf
Estou tentando obter os dados das tabelas nestePDF [https://www.dropbox.com/s/y3nivxhjvvzva7d/test1.pdf?dl=0]. Eu tentei o pdfminer e o pypdf com um pouco de sorte, mas não consigo realmente obter os dados das tabelas. É assim que uma das ...
Extraindo texto de um arquivo PDF usando o PDFMiner em python?
Python Versão 2.7 Eu estou procurando documentaçãoou exemplos de como extrair texto de um arquivo PDF usando o PDFMiner com Python. Parece que o PDFMiner atualizou sua API e todos os exemplos relevantes que encontrei contêm código desatualizado ...
Destacar texto em um PDF com Python [fechado]
Estou trabalhando no mecanismo de pesquisa personalizado para o meu corpus de dados em PDF. Eu tenho uma camada de transformação capaz de despejar o conteúdo do PDF em texto (usando o Apache Tika e o GROBID). Concluí as camadas de pesquisa e ...
O que fazer com os CIDs no texto extraído pelo PDFMiner?
Tenho alguns PDFs em hindi e texto extraível. eu useipdfminer.six [https://github.com/pdfminer/pdfminer.six]para python 3.6, para fazer a extração. A saída se parece com: [/imgs/cZGKz.png] Como se pode ver, existem vários caracteres que são ...
A fonte não pode ser extraída pelo PDFMiner
Estou convertendo alguns relatórios em PDF para texto sem formatação usando o PDFMiner e vários dos meus PDFs de entrada são lançados com algumas linhas reconhecidas e, em seguida, uma lista de (cid:% d) um pouco como esta ... Relatório de ...
pdfminer - ImportError: nenhum módulo chamado pdfminer.pdfdocument
Estou tentando instalar o pdfMiner para trabalhar com o CollectiveAccess. Meu host (pair.com) me forneceu as seguintes informações para ajudar nessa missão: Ao compilar, provavelmente será necessário instruir o instalação para usar o espaço da ...
Python PDFMIner - PDF para CSV
Quero poder converter PDFs em arquivos CSV e encontrei vários scripts úteis, mas, sendo novo no Python, tenho uma pergunta: Onde você especifica o caminho do arquivo PDF e CSV para o qual deseja imprimir? Estou usando o Python 2.7.11 e o ...
pdfminer3k não possui um método chamado create_pages no PDFPage
Como eu quero passar do python 2 para o 3, tentei trabalhar com o pdfmine.3kr no python 3.4. Parece que eles editaram tudo. Seus registros de alterações não refletem as alterações que foram feitas, mas não tive sucesso ao analisar o pdf com o ...