Использование WordNet для определения семантического сходства между двумя текстами?

Как вы можете определить семантическое сходство между двумя текстами в Python, используя WordNet?

Очевидная предварительная обработка будет состоять в удалении стоп-слов и переноса, но что тогда?

Единственный способ, которым я могу придумать, - это рассчитать расстояние пути WordNet между каждым словом в двух текстах. Это стандарт для униграмм. Но это большие (400 слов) тексты, которые являются документами на естественном языке, со словами, которые не имеют какого-либо определенного порядка или структуры (кроме тех, которые наложены грамматикой английского языка). Итак, какие слова вы бы сравнили между текстами? Как бы вы сделали это в Python?

Ответы на вопрос(1)

Ваш ответ на вопрос