Script para buscar texto desde PDF

Problema

En la plataforma Mac OS X, me gustaría escribir un script, ya sea en Python o Tcl para buscar texto dentro de un archivo PDF y extraer las partes relevantes. Aprecio cualquier ayuda.

Fondo

Estoy escribiendo guiones para mirar dentro de un PDF para determinar si se trata de una factura, de qué compañía y durante qué período. Basándome en esta información, cambio el nombre del PDF y lo muevo a un directorio apropiado. Por ejemplo, un archivo comoStatement_03948293929384.pdf podría convertirse2012-07-15 Water Bill.pdf y me mudé a miUtilities carpeta.

¿Qué he hecho hasta ahora?He buscado herramientas de PDF a texto sin formato, pero todavía no he encontrado nada.Busqué en el wiki de Tcl y encontré un ejemplo, pero no pude hacerlo funcionar (busqué texto en PDF, pero no lo encontré).Estoy investigandopdf-parser.py por Didier StevensEscuché sobre un paquete de Python llamado pyPdf y lo veré a continuación.Actualizar

He encontrado una herramienta de línea de comandos llamadapdftotext escrito por Glyph & Cog, LLC; construido y empaquetado porCarsten Bluem. Esta herramienta es sencilla y resuelve mi problema. Todavía estoy buscando aquellas herramientas que pueden buscar PDF directamente, sin tener que convertir a un archivo de texto.

Respuestas a la pregunta(1)

Su respuesta a la pregunta