Construindo um mecanismo de busca rápido semântico MySQL para artigos privados a partir do zero

Eu estou trabalhando em um projeto que envolverátexto completo e semântico buscas de artigos dentro do site (se não for possível combiná-lo, o usuário pode selecionar qualquer opção). Esses artigos são baseados em assinatura e só podem ser pesquisados ​​após o login; para que eles não sejam acessíveis a mecanismos de pesquisa externos ou suas APIs.

Eu li sobre Esfinge para pesquisas de palavras-chave de texto completo (e pretendo implementá-lo para esse aspecto), mas não tenho certeza sobre como criar um mecanismo de pesquisa semântico com base nisso. por exemplo. A pesquisa por "Presidente dos EUA" deve listar artigos que contenham referências aos nomes reais dos presidentes dos EUA, por exemplo. George Washington, Bill Clinton (ou William Jefferson Clinton).

Eu tenho idéias que talvez um tipo de sistema de marcação possa ser usado para relacionar várias palavras-chave, por exemplo, relacionar o Presidente a George Washington e o Presidente a Bill Clinton, mas como os dados são realmente enormes e muitas dessas relações existirão, não sei como promover essa ideia.

Por favor, me aconselhe sobre como construir um mecanismo de busca semântico (acho que o Sphinx pode lidar com a pesquisa de palavras-chave em texto completo) do zero. Caso contrário, por favor informe-me de quaisquer recursos baseados na Internet ou se já houver software existente em qualquer idioma que eu possa integrar em meu aplicativo.

P.S. Meu banco de dados de escolha é MySQL (por favor, se outro sistema de banco de dados é mais adequado para a tarefa), e eu prefiro programar em PHP, mas se eu precisar aprender Python ou qualquer outra linguagem que seja mais eficaz para esta tarefa, eu esteja disposto.

Eu já pesquiseianswers.semanticweb.com

questionAnswers(2)

yourAnswerToTheQuestion