Budowanie szybkiej semantycznej wyszukiwarki MySQL dla artykułów prywatnych od podstaw

Pracuję nad projektem, który będzie obejmowałpełny tekst i semantyczny wyszukiwanie artykułów w witrynie (jeśli nie jest możliwe ich połączenie, użytkownik może wybrać jedną z opcji). Artykuły te są oparte na subskrypcji i można je wyszukać tylko po zalogowaniu; więc nie są dostępne dla zewnętrznych wyszukiwarek ani ich interfejsów API.

Czytałem o Sfinksie w przypadku pełnotekstowego wyszukiwania słów kluczowych (i zamierzam go zaimplementować w tym aspekcie), ale nie jestem pewien, jak zbudować z tego semantyczną wyszukiwarkę. na przykład Wyszukiwanie „prezydenta USA” powinno zawierać artykuły zawierające odniesienia do rzeczywistych nazwisk prezydentów USA, np. George Washington, Bill Clinton (lub William Jefferson Clinton).

Mam pomysły, że może być stosowany rodzaj systemu tagowania do powiązania różnych słów kluczowych, np. odwołać prezydenta do George'a Washingtona i prezydenta do Billa Clintona, ale ponieważ dane są naprawdę ogromne i wiele takich relacji będzie istniało, nie wiem, jak rozwinąć ten pomysł.

Proszę o poradę dotyczącą budowania wyszukiwarki semantycznej (sądzę, że Sphinx może obsługiwać wyszukiwanie pełnotekstowe słów kluczowych) od podstaw. W przeciwnym razie poinformuj mnie o wszelkich zasobach internetowych lub jeśli istnieje już oprogramowanie w dowolnym języku, który mogę zintegrować z moją aplikacją.

P.S. Moja wybrana baza danych to MySQL (proszę o poradę, jeśli inny system baz danych jest bardziej odpowiedni dla tego zadania), a ja wolę programować w PHP, ale jeśli będę musiał nauczyć się Pythona lub innego języka, który będzie bardziej skuteczny w tym zadaniu, będę bądź chętny.

Szukałem jużanswer.semanticweb.com

questionAnswers(2)

yourAnswerToTheQuestion