¿Hay alguna manera de obtener los datos de texto "originales" para OpenNLP?

Sé que esta pregunta se hizo antes, pero la respuesta no fue satisfactoria (en el sentido de que la respuesta era solo un enlace).

Entonces mi pregunta es, ¿hay alguna manera de extender los modelos openNLP existentes? Ya sé sobre la técnica con DBPedia / Wikipedia. Pero, ¿qué pasa si solo quiero agregar algunas líneas de texto para mejorar los modelos? ¿Realmente no hay forma? (Si es así, eso sería realmente estúpido ...)

Respuestas a la pregunta(2)

Su respuesta a la pregunta