¿Qué kit de herramientas de PNL para usar en JAVA? [cerrado

Estoy trabajando en un proyecto que consiste en un sitio web que se conecta con el NCBI (Centro Nacional de Información Biotecnológica) y busca artículos allí. La cosa es que tengo que hacer un poco de minería de texto en todos los resultados. Estoy usando el lenguaje JAVA para minería de texto y AJAX con ICEFACES para el desarrollo del sitio web. Qué tengo: una lista de artículos devueltos de una búsqueda. Cada artículo tiene una identificación y un resumen. La idea es obtener palabras clave de cada texto abstracto. Y luego compare todas las palabras clave de todos los resúmenes y encuentre las más repetidas. Entonces, muestre en el sitio web las palabras relacionadas para la búsqueda. Algunas ideas ? Busqué mucho en la web, y sé que hay un reconocimiento de entidad nombrada, etiquetado de parte del discurso, hay el tesauro GENIA para NER en genes y proteínas, ya intenté derivar ... Detener listas de palabras, etc. solo necesito saber el mejor método para resolver este problema. Muchas gracias

Respuestas a la pregunta(8)

Su respuesta a la pregunta