Использование WordNet для определения семантического сходства между двумя текстами?

Question

Jul 13, 2012, 04:35 AM

python nlp semantic-analysis nltk wordnet

Использование WordNet для определения семантического сходства между двумя текстами?

Как вы можете определить семантическое сходство между двумя текстами в Python, используя WordNet?

Очевидная предварительная обработка будет состоять в удалении стоп-слов и переноса, но что тогда?

Единственный способ, которым я могу придумать, - это рассчитать расстояние пути WordNet между каждым словом в двух текстах. Это стандарт для униграмм. Но это большие (400 слов) тексты, которые являются документами на естественном языке, со словами, которые не имеют какого-либо определенного порядка или структуры (кроме тех, которые наложены грамматикой английского языка). Итак, какие слова вы бы сравнили между текстами? Как бы вы сделали это в Python?

Использование WordNet для определения семантического сходства между двумя текстами?

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Использование WordNet для определения семантического сходства между двумя текстами?

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы