Результаты поиска по запросу "stemming"
не является предопределенным, вызывая ошибку имени. Смотрите мои последние две строки для исправления.
ю, как выполнить SnowballStemmer для одного слова (в моем случае, для русского). Делаем следующие вещи: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'Как я могу ...
Стандартный анализатор со стволом
Есть ли способ интегрировать
в Jupyter открывается графический интерфейс на моем компьютере Win10. (Jupyter работает на локальном хосте, а не на удаленном хосте.)
у импортироватьwordnet словарь, но когда я импортирую форму словаряwordnet я вижу эту ошибку: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2] No such file or directory: 'C:\\Program ...
как индексировать слова с их префиксом в solr?
Я использую Solr 3.3 для индексации своих файлов, я хочу, чтобы Solr индексировал слова с их суффиксами, например, я хочу индексировать цвета, как цвета, и при поиске цвета Solr показывает любой документ, который имеет цвета.
Установка TreeTagger прошла успешно, но не удается открыть файл .par
Кто-нибудь знает, как решить эту ошибку чтения файла в
Еще одна вещь, которую вы можете сделать, - индексировать один и тот же текст, не вставляя в одну строку, а вставляя в другую. Повысьте необоснованное поле, и оно должно отдавать предпочтение точным версиям слов по сравнению с основанными на версиях. Конечно, вы также можете написать свой собственный синтаксический анализатор запросов, который направляет фразы в кавычках только в необоснованное поле.
м экземпляре Solr я включил использование стволовых символов. Я предполагал, что для точного поиска по слову, не отключая основание, это будет так же просто, как поместить слово в кавычки. Это, однако, не похоже на дело? Есть ли простой способ ...
Установка TreeTagger прошла успешно, но не удается открыть файл .par
Кто-нибудь знает, как решить эту ошибку чтения файла вTreeTagger это обычный инструмент для обработки естественного языка, используемый дляPOS тег, лемматизировать и куски предложения? alvas@ikoma:~/treetagger$ echo 'Hello world!' | ...
Преобразование множественного числа в единственное число в текстовом файле с помощью Python
У меня есть текстовые файлы, которые выглядят так:
Страница 1 из 2