Результаты поиска по запросу "stemming"
Как мне сделать слово «Стемминг» или «Лемматизация»?
Я пробовал PorterStemmer и Snowball, но оба не работают над всеми словами, пропуская некоторые очень распространенные. Мои тестовые слова:кошки бегали бегали кактусы кактусы сообщества кактусов", и оба получают менее половины прав. Смотрите ...
Установка TreeTagger прошла успешно, но не удается открыть файл .par
Кто-нибудь знает, как решить эту ошибку чтения файла вTreeTagger это обычный инструмент для обработки естественного языка, используемый дляPOS тег, лемматизировать и куски предложения? alvas@ikoma:~/treetagger$ echo 'Hello world!' | ...
как индексировать слова с их префиксом в solr?
Я использую Solr 3.3 для индексации своих файлов, я хочу, чтобы Solr индексировал слова с их суффиксами, например, я хочу индексировать цвета, как цвета, и при поиске цвета Solr показывает любой документ, который имеет цвета.
не является предопределенным, вызывая ошибку имени. Смотрите мои последние две строки для исправления.
ю, как выполнить SnowballStemmer для одного слова (в моем случае, для русского). Делаем следующие вещи: from nltk.stem.snowball import SnowballStemmer stemmer = SnowballStemmer("russian") stemmer.stem("Василий") 'Васил'Как я могу ...
Еще одна вещь, которую вы можете сделать, - индексировать один и тот же текст, не вставляя в одну строку, а вставляя в другую. Повысьте необоснованное поле, и оно должно отдавать предпочтение точным версиям слов по сравнению с основанными на версиях. Конечно, вы также можете написать свой собственный синтаксический анализатор запросов, который направляет фразы в кавычках только в необоснованное поле.
м экземпляре Solr я включил использование стволовых символов. Я предполагал, что для точного поиска по слову, не отключая основание, это будет так же просто, как поместить слово в кавычки. Это, однако, не похоже на дело? Есть ли простой способ ...
Установка TreeTagger прошла успешно, но не удается открыть файл .par
Кто-нибудь знает, как решить эту ошибку чтения файла в
сайт, который является библиотекой с открытым исходным кодом, насколько я могу судить.
ing - это то, что нужно в системах тегов. Я использую вкусно, и у меня нет времени, чтобы управлять и обрезать свои метки. Я немного более осторожен с моим блогом, но он не идеален. Я пишу программное обеспечение для встраиваемых систем, которое ...
в Jupyter открывается графический интерфейс на моем компьютере Win10. (Jupyter работает на локальном хосте, а не на удаленном хосте.)
у импортироватьwordnet словарь, но когда я импортирую форму словаряwordnet я вижу эту ошибку: for l in open(WNSEARCHDIR+'/lexnames').readlines(): IOError: [Errno 2] No such file or directory: 'C:\\Program ...
Страница 1 из 2