Analisador Java RTF
Alguém sabe de um analisador RTF robusto que eu possa usar em Java? Eu preciso extrair texto sem formatação, incluindo texto internacional. Também seria bom extrair imagens e arquivos incorporados. Também pode ser um C ++ ou outra biblioteca que eu possa chamar facilmente ou, se houver um bom código fonte, posso converter para Java.
As bibliotecas a seguir não cobrem o suficiente do RTF ou não analisam alguns RTFs válidos
O RTFEditorKit do Java Swing, o Apache Tikka, bastante básico e frágil, e muitas outras ferramentas usam isso.uma biblioteca RTF do iText (com.lowagie.etc ...), não muito abrangentebiblioteca rtf etranslate (esta é a mais completa das java) Não tenho certeza se existe uma versão atualizada, mas a versão que eu tenho falha em algumas das minhas coleções rtf (os RTFs são válidos, pelo menos eles abrem em MsWord e OpenOffice OK ).Há uma biblioteca C # que é razoavelmente completa, mas, infelizmente ... é C # e não Java.http://www.codeproject.com/Articles/27431/Writing-Your-Own-RTF-Converter
Eu também procurei no OpenOffice, ele é muito lento para o que eu preciso, embora provavelmente seja muito abrangente.
(Eu fiz pesquisas na web e empilhei buscas de estouro antes de postar esta pergunta, então se você está me encaminhando para um antigo post "já perguntado", provavelmente não tem uma resposta lá. Mas fique à vontade para apontar, no caso Eu perdi!)