Библиотеки для разбора PDF, PostScript и / или DjVu

То, что я хочу сделать, довольно просто: учитывая файл PDF / PS / DjVu, содержащий статью / книгу, найдите авторов и название статьи (любые другие метаданные были бы хорошими, но менее необходимыми). Это признание не обязательно должно быть идеальным, но я хотел бы сделать его настолько хорошим, насколько смогу. Я ищу библиотеки .NET и / или Java с открытым исходным кодом (предпочтительно .NET), которые позволяют получить доступ к метаданным и содержимому этих файлов.

Для PDF я нашелPDFBox (.NET / Java) иБиблиотека PDF (.NET), но могут быть и лучшие альтернативы, о которых я не знаю; для Postscript и DjVu я ничего не нашел.

Ответы на вопрос(4)

Ваш ответ на вопрос