Como exportar campos de formulário pdf para xml automaticamente
eu tenho umpdf
incluindo campos de formulário e precisa exportar os dados para umxml
ArquivoAUTOMATICAMENTE. Aqui está uma tela de um formulário de amostra que criei para teste:
Nota: Funciona muito bem exportandoMANUALMENTE usando o Acrobat Professional clicando emTools > Form > Export Form Data
e finalmente escolheu a extensão xml para a saída do arquivo. Este é o resultado que estou obtendo quando o exporto manualmente:
<?xml version="1.0" encoding="UTF-8"?>
<fields>
<first_name>John</first_name>
<last_name>Doe</last_name>
</fields>
No entanto, preciso automatizá-lo, por exemplo com umscript python, Implementação Java ou algunsferramentas de linha de comando. Quaisquer ideias que bibliotecas ou ferramentas eu possa usar para exportar dados do campo de formulário paraxml
? A ferramenta ou biblioteca deve serCódigo aberto, que eu possa integrá-lo no meu fluxo de trabalho.
Eu já tentei pythonpdfminer
biblioteca, o que me ajudou a exportar peças estáticas (comoStatic form header
, First name:
eLast name:
) do arquivo pdf: mas como exportar dados do campo do formulário (no meu caso, o conteúdo dos campos do formuláriofirst_name
elast_name
) ??
Edição: Sinta-se livre para baixar o arquivo sample.pdfaqui.