OCR de código aberto [fechado]

Estou procurando uma biblioteca OCR de código aberto que roda no Linux. Preciso que isso funcione para PNGs e PDFs. Gostaria principalmente de fazer interface desta biblioteca de java ou ruby. Alguma idéia se há algo disponível?

Saudações.