Resultados da pesquisa a pedido "pdfminer"

14 a resposta

Como uso o pdfminer como uma biblioteca

Estou tentando obter dados de texto de um pdf usando pdfminer [http://www.unixuser.org/~euske/python/pdfminer/index.html]. Consigo extrair esses dados para um arquivo .txt com êxito com a ferramenta de linha de comando pdfminer pdf2txt.py. ...

2 a resposta

Extraindo tabelas de um pdf

Estou tentando obter os dados das tabelas nestePDF [https://www.dropbox.com/s/y3nivxhjvvzva7d/test1.pdf?dl=0]. Eu tentei o pdfminer e o pypdf com um pouco de sorte, mas não consigo realmente obter os dados das tabelas. É assim que uma das ...

2 a resposta

Extraindo texto de um arquivo PDF usando o PDFMiner em python?

Python Versão 2.7 Eu estou procurando documentaçãoou exemplos de como extrair texto de um arquivo PDF usando o PDFMiner com Python. Parece que o PDFMiner atualizou sua API e todos os exemplos relevantes que encontrei contêm código desatualizado ...

1 a resposta

Destacar texto em um PDF com Python [fechado]

Estou trabalhando no mecanismo de pesquisa personalizado para o meu corpus de dados em PDF. Eu tenho uma camada de transformação capaz de despejar o conteúdo do PDF em texto (usando o Apache Tika e o GROBID). Concluí as camadas de pesquisa e ...

1 a resposta

O que fazer com os CIDs no texto extraído pelo PDFMiner?

Tenho alguns PDFs em hindi e texto extraível. eu useipdfminer.six [https://github.com/pdfminer/pdfminer.six]para python 3.6, para fazer a extração. A saída se parece com: [/imgs/cZGKz.png] Como se pode ver, existem vários caracteres que são ...

0 a resposta

A fonte não pode ser extraída pelo PDFMiner

Estou convertendo alguns relatórios em PDF para texto sem formatação usando o PDFMiner e vários dos meus PDFs de entrada são lançados com algumas linhas reconhecidas e, em seguida, uma lista de (cid:% d) um pouco como esta ... Relatório de ...

2 a resposta

pdfminer - ImportError: nenhum módulo chamado pdfminer.pdfdocument

Estou tentando instalar o pdfMiner para trabalhar com o CollectiveAccess. Meu host (pair.com) me forneceu as seguintes informações para ajudar nessa missão: Ao compilar, provavelmente será necessário instruir o instalação para usar o espaço da ...

1 a resposta

Python PDFMIner - PDF para CSV

Quero poder converter PDFs em arquivos CSV e encontrei vários scripts úteis, mas, sendo novo no Python, tenho uma pergunta: Onde você especifica o caminho do arquivo PDF e CSV para o qual deseja imprimir? Estou usando o Python 2.7.11 e o ...

2 a resposta

pdfminer3k não possui um método chamado create_pages no PDFPage

Como eu quero passar do python 2 para o 3, tentei trabalhar com o pdfmine.3kr no python 3.4. Parece que eles editaram tudo. Seus registros de alterações não refletem as alterações que foram feitas, mas não tive sucesso ao analisar o pdf com o ...