Результаты поиска по запросу "stemming"
не является предопределенным, вызывая ошибку имени. Смотрите мои последние две строки для исправления.
ю, как выполнить SnowballStemmer для одного слова (в моем случае, для русского). Делаем следующие вещи: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'Как я могу ...
сайт, который является библиотекой с открытым исходным кодом, насколько я могу судить.
ing - это то, что нужно в системах тегов. Я использую вкусно, и у меня нет времени, чтобы управлять и обрезать свои метки. Я немного более осторожен с моим блогом, но он не идеален. Я пишу программное обеспечение для встраиваемых систем, которое ...
Преобразование множественного числа в единственное число в текстовом файле с помощью Python
У меня есть текстовые файлы, которые выглядят так:
http://elexicon.wustl.edu/query14/query14.asp
ли способ получить базовое слово вместо корневого слова в stemming, используя NLP в R? Код: > #Loading libraries > library(tm) > library(slam) > > #Vector > Vec=c("happyness happies happys","sky skies") > > #Creating Corpus ...
Стандартный анализатор со стволом
Есть ли способ интегрировать
предоставляет ряд токенизаторов. Их можно использовать для остановки и удаления слов. Это простое и эффективное средство противодействия.
абатываю некоторые тексты на английском языке в приложении Java, и мне нужно остановить их. Например, из текста «удобства / удобства» мне нужно получить «аменит». Функция выглядит так: String stemTerm(String term){ ... }Я нашел Lucene Analyzer, ...
Еще одна вещь, которую вы можете сделать, - индексировать один и тот же текст, не вставляя в одну строку, а вставляя в другую. Повысьте необоснованное поле, и оно должно отдавать предпочтение точным версиям слов по сравнению с основанными на версиях. Конечно, вы также можете написать свой собственный синтаксический анализатор запросов, который направляет фразы в кавычках только в необоснованное поле.
м экземпляре Solr я включил использование стволовых символов. Я предполагал, что для точного поиска по слову, не отключая основание, это будет так же просто, как поместить слово в кавычки. Это, однако, не похоже на дело? Есть ли простой способ ...
легкий стеммер
Java Stemer для арабского языка. Я нашел библиотеку под названием «AraMorph», но ее вывод неуправляем, и он формирует слова, которые являются нежелательными. Есть ли еще какой-нибудь стеммер для арабского?
Страница 1 из 2