Construyendo un rápido motor de búsqueda semántico de MySQL para artículos privados desde cero

Estoy trabajando en un proyecto que involucrarátexto completo y semántico búsquedas de artículos dentro del sitio (si no es posible combinarlo, el usuario puede seleccionar cualquiera de las opciones). Estos artículos están basados ​​en suscripciones y solo se pueden buscar después de iniciar sesión; por lo que no son accesibles a los motores de búsqueda externos o sus API.

Leí sobre la esfinge para búsquedas de palabras clave de texto completo (y pretendo implementarlo para ese aspecto) pero no estoy seguro de cómo construir un motor de búsqueda semántico a partir de esto. p.ej. La búsqueda de "Presidente de EE. UU." Debería incluir artículos que contengan referencias a los nombres reales de los presidentes de EE. UU. George Washington, Bill Clinton (o William Jefferson Clinton).

Tengo ideas de que tal vez se pueda usar una especie de sistema de etiquetado para relacionar varias palabras clave, por ejemplo. relacione al presidente con George Washington y al presidente con Bill Clinton, pero como los datos son realmente enormes y existirán muchas de esas relaciones, no sé cómo promover esta idea.

Por favor, dime cómo construir un motor de búsqueda semántico (supongo que Sphinx puede manejar la búsqueda por palabra clave en texto completo) desde cero. De lo contrario, infórmeme sobre cualquier recurso basado en Internet o si ya existe un software en algún idioma que pueda integrar en mi aplicación.

PD Mi base de datos de elección es MySQL (por favor avise si otro sistema de base de datos es más adecuado para la tarea), y prefiero programar en PHP, pero si necesito aprender Python o cualquier otro idioma que sea más efectivo para esta tarea, estar dispuesto.

Ya busqué enanswers.semanticweb.com

Respuestas a la pregunta(2)

Su respuesta a la pregunta