Результаты поиска по запросу "lemmatization"

2 ответа

Установка TreeTagger прошла успешно, но не удается открыть файл .par

Кто-нибудь знает, как решить эту ошибку чтения файла вTreeTagger это обычный инструмент для обработки естественного языка, используемый дляPOS тег, лемматизировать и куски предложения? alvas@ikoma:~/treetagger$ echo 'Hello world!' | ...

1 ответ

Большое спасибо alvas. Это помогает.

емые участники сообщества! Во время предварительной обработки данных, после разделения raw_data на токены, я использовал популярный WordNet Lemmatizer для генерации основ. Я выполняю эксперименты с набором данных, который имеет 18953 ...

2 ответа

Установка TreeTagger прошла успешно, но не удается открыть файл .par

Кто-нибудь знает, как решить эту ошибку чтения файла в

ТОП публикаций

21 ответ

Как мне сделать слово «Стемминг» или «Лемматизация»?

Я пробовал PorterStemmer и Snowball, но оба не работают над всеми словами, пропуская некоторые очень распространенные. Мои тестовые слова:кошки бегали бегали кактусы кактусы сообщества кактусов", и оба получают менее половины прав. Смотрите ...

2 ответа

Можно ли ускорить Wordnet Lemmatizer?

Я использую Лемматизатор Wordnet через NLTK на Коричневом Корпусе (чтобы определить, используются ли в нем существительные больше в форме единственного или множественного числа). то естьfrom nltk.stem.wordnet import WordNetLemmatizer l = ...

2 ответа

Можно ли ускорить Wordnet Lemmatizer?

2 ответа

Лемматизация неанглийских слов?

Я хотел бы применить лемматизацию, чтобы уменьшить флективные формы слов. Я знаю, что для английского языка WordNet предоставляет такую ​​функциональность, н...

6 ответов

лемматизация в Wordnet и теги pos в python

Я хотел использовать лемматизатор wordnet в python, и я узнал, что по умолчанию тэг pos равен NOUN и что он не выводит правильную лемму для глагола, если тэг pos явно не указан как VERB. У меня вопрос, какой метод лучше всего подходит для точной ...

6 ответов

лемматизация в Wordnet и теги pos в python

Я хотел использовать лемматизатор wordnet в python, и я узнал, что по умолчанию тэг pos равен NOUN и что он не выводит правильную лемму для глагола, если тэг...

3 ответа

Простейший метод лемматизации текста в Scala и Spark

Я хочу использовать лемматизацию для текстового файла: