Результаты поиска по запросу "stemming"

2 ответа

Установка TreeTagger прошла успешно, но не удается открыть файл .par

Кто-нибудь знает, как решить эту ошибку чтения файла в

2 ответа

Использование нескольких множественных чисел с помощью лемматизатора Wordnet не работает

1 ответ

Стандартный анализатор со стволом

Есть ли способ интегрировать

ТОП публикаций

3 ответа

Преобразование множественного числа в единственное число в текстовом файле с помощью Python

У меня есть текстовые файлы, которые выглядят так:

4 ответа

есть ли какой-либо стеммер, доступный для индийского языка [закрыто]

0 ответов

 не является предопределенным, вызывая ошибку имени. Смотрите мои последние две строки для исправления.

ю, как выполнить SnowballStemmer для одного слова (в моем случае, для русского). Делаем следующие вещи: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'Как я могу ...

6 ответов

 предоставляет ряд токенизаторов. Их можно использовать для остановки и удаления слов. Это простое и эффективное средство противодействия.

абатываю некоторые тексты на английском языке в приложении Java, и мне нужно остановить их. Например, из текста «удобства / удобства» мне нужно получить «аменит». Функция выглядит так: String stemTerm(String term){ ... }Я нашел Lucene Analyzer, ...

4 ответа

 сайт, который является библиотекой с открытым исходным кодом, насколько я могу судить.

ing - это то, что нужно в системах тегов. Я использую вкусно, и у меня нет времени, чтобы управлять и обрезать свои метки. Я немного более осторожен с моим блогом, но он не идеален. Я пишу программное обеспечение для встраиваемых систем, которое ...

2 ответа

Еще одна вещь, которую вы можете сделать, - индексировать один и тот же текст, не вставляя в одну строку, а вставляя в другую. Повысьте необоснованное поле, и оно должно отдавать предпочтение точным версиям слов по сравнению с основанными на версиях. Конечно, вы также можете написать свой собственный синтаксический анализатор запросов, который направляет фразы в кавычках только в необоснованное поле.

м экземпляре Solr я включил использование стволовых символов. Я предполагал, что для точного поиска по слову, не отключая основание, это будет так же просто, как поместить слово в кавычки. Это, однако, не похоже на дело? Есть ли простой способ ...

5 ответов

легкий стеммер

Java Stemer для арабского языка. Я нашел библиотеку под названием «AraMorph», но ее вывод неуправляем, и он формирует слова, которые являются нежелательными. Есть ли еще какой-нибудь стеммер для арабского?