ю, как выполнить SnowballStemmer для одного слова (в моем случае, для русского). Делаем следующие вещи: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'Как я могу ...

porter-stemmer lucene java

6 ответов

предоставляет ряд токенизаторов. Их можно использовать для остановки и удаления слов. Это простое и эффективное средство противодействия.

абатываю некоторые тексты на английском языке в приложении Java, и мне нужно остановить их. Например, из текста «удобства / удобства» мне нужно получить «аменит». Функция выглядит так: String stemTerm(String term){ ... }Я нашел Lucene Analyzer, ...

nlp tags algorithm

4 ответа

сайт, который является библиотекой с открытым исходным кодом, насколько я могу судить.

ing - это то, что нужно в системах тегов. Я использую вкусно, и у меня нет времени, чтобы управлять и обрезать свои метки. Я немного более осторожен с моим блогом, но он не идеален. Я пишу программное обеспечение для встраиваемых систем, которое ...

search lucene solr

2 ответа

Еще одна вещь, которую вы можете сделать, - индексировать один и тот же текст, не вставляя в одну строку, а вставляя в другую. Повысьте необоснованное поле, и оно должно отдавать предпочтение точным версиям слов по сравнению с основанными на версиях. Конечно, вы также можете написать свой собственный синтаксический анализатор запросов, который направляет фразы в кавычках только в необоснованное поле.

м экземпляре Solr я включил использование стволовых символов. Я предполагал, что для точного поиска по слову, не отключая основание, это будет так же просто, как поместить слово в кавычки. Это, однако, не похоже на дело? Есть ли простой способ ...

java arabic porter-stemmer

5 ответов

легкий стеммер

Java Stemer для арабского языка. Я нашел библиотеку под названием «AraMorph», но ее вывод неуправляем, и он формирует слова, которые являются нежелательными. Есть ли еще какой-нибудь стеммер для арабского?

Страница 1 из 2

Результаты поиска по запросу "stemming"

Установка TreeTagger прошла успешно, но не удается открыть файл .par

Использование нескольких множественных чисел с помощью лемматизатора Wordnet не работает

Стандартный анализатор со стволом

Популярные теги

ТОП публикаций

Преобразование множественного числа в единственное число в текстовом файле с помощью Python

есть ли какой-либо стеммер, доступный для индийского языка [закрыто]

не является предопределенным, вызывая ошибку имени. Смотрите мои последние две строки для исправления.