Можно ли ускорить Wordnet Lemmatizer?
используя лемматизатор Wordnet через NLTK в «Коричневом корпусе» (чтобы определить, используются ли в нем существительные больше в форме единственного или множественного числа).
то есть яfrom nltk.stem.wordnet import WordNetLemmatizer
l = WordnetLemmatizer()
Мы заметили, что даже самые простые запросы, такие как приведенный ниже, занимают довольно много времени (по крайней мере, секунду или две).l("cats")
Предположительно, это связано с тем, что для каждого запроса необходимо установить веб-соединение с Wordnet? ..
Интересно, есть ли способ по-прежнему использовать Wordnet Lemmatizer, но будет ли он работать намного быстрее? Например, поможет ли мне вообще загрузить Wordnet на мою машину? Или какие-либо другие предложения? Я
пытаюсь понять, можно ли сделать лемматизатор Wordnet быстрее, чем пытаться использовать другой лемматизатор, потому что ямы обнаружили, что он работает лучше всего среди других, таких как Портер и Ланкастер.