Compruebe si un archivo PDF es válido (Python)
Obtengo un archivo a través de una carga HTTP y necesito asegurarme de que sea un archivo pdf. El lenguaje de programación es Python, pero esto no debería importar.
Pensé en las siguientes soluciones:
Compruebe si los primeros bytes de la cadena son "% PDF". @Esta no es una buena comprobación, pero evita que el uso cargue otros archivos accidentalmente.
Pruebe libmagic (el comando "archivo" en el bash lo usa). @ Esto hace exactamente la misma comprobación que 1.
Tome una biblioteca e intente leer el recuento de páginas del archivo. @ Si la biblioteca puede leer un recuento de páginas, debería ser un pdf válido. Problema: no sé una lib para python que pueda hacer esto
¿Alguien tiene alguna solución para una lib u otro truco?
Gracia