¿Marcos de extracción de información / coincidencia de patrones basados en reglas de código abierto? [cerrado]

Question

Jul 27, 2013, 12:20 AM

named open-source information-extraction text nlp

¿Marcos de extracción de información / coincidencia de patrones basados en reglas de código abierto? [cerrado]

Estoy comprando un marco de código abierto para escribir reglas de gramática en lenguaje natural para la comparación de patrones sobre anotaciones. Podría pensarlo como expresiones regulares pero coincidiendo en el token en lugar del nivel de carácter. Dicho marco debería permitir que los criterios de coincidencia hagan referencia a otros atributos adjuntos a los tokens o tramos de entrada, así como a modificar dichos atributos en una acción.

Hay tres opciones que conozco que se ajustan a esta descripción:

GATE Expresiones Java sobre Anotaciones (JAPE)TokensRegex de Stanford CoreNLP UIMA Ruta (Tutorial)Expresión de gráfico (GExp)*

¿Hay otras opciones como estas disponibles en este momento?

Herramientas relacionadas

Si bien sé que los generadores de parser generales comoAntlr También puede servir para este propósito, estoy buscando algo que se adapte más específicamente para el procesamiento del lenguaje natural o la extracción de información.UIMA incluye unAnexador de expresiones regulares Complemento para declarar reglas en XML, pero parece operar en el carácter en lugar de objetos de alto nivel.Sé que este tipo de tarea a menudo se realiza con modelos estadísticos, pero para dominios estrechos y estructurados hay un beneficio en las reglas de elaboración manual.

* Con GExp, las 'reglas' se implementan en el código, pero como hay pocas opciones, elegí incluirlo.