Результаты поиска по запросу "nltk"
Как я могу добавить больше языков к стоп-словам в NLTK?
Я использую NLTK со стоп-словами для определения языка документа, используя метод, описанный Алехандро Ноллой ...
Алгоритмы семантической связанности - python [закрыто]
Я хочу найти взаимосвязь между двумя синтаксисами, и я наткнулся на множество алгоритмов, таких как resnik, lin, wu palmer, алгоритм пути, leacock chodorow и т. Д. Может кто-нибудь сказать мне, какой из этих алгоритмов наиболее эффективен?
Как мне подойти к этой задаче классификации именованных объектов?
Я задаю связанный вопросВот [https://stackoverflow.com/questions/8219772/how-do-i-form-a-feature-vector-for-a-classifier-targeted-at-named-entity-recogni] но этот вопрос носит более общий характер. Я взял большую корпорацию и прокомментировал ...
Создание и использование StanfordTagger в NLTK
Я прошу прощения за новичок в этом вопросе - я пытался выяснить, как Python упаковывает пространство имен, но тонкости, кажется, ускользают от меня. Я бы хотел использовать оболочку Python для тега части речи Стэнфорда. У меня не было проблем с ...
формат обучающих данных для nltk punkt
Я хотел бы запустить nltk punkt, чтобы разделить предложения. Модели тренировок нет, поэтому я тренирую модель отдельно, но я не уверен, что формат данных обучения, который я использую, правильный. Мои тренировочные данные - одно предложение на ...
Что тэггер NLTK POS просит меня скачать?
Я только начал использовать тегер части речи, и у меня много проблем. Я начал маркировку POS со следующего: import nltk text=nltk.word_tokenize("We are going out.Just you and me.")Когда я хочу напечатать'text'происходит следующее: print ...
Использование моего собственного корпуса для классификации категорий в Python NLTK
Я новичок в NTLK / Python и мне удалось загрузить свой собственный корпус с помощью CategoryorizedPlaintextCorpusReader, но как мне на самом деле обучать и использовать данные для классификации текста? >>> from nltk.corpus.reader import ...
NLTK словосочетания для конкретных слов
Я знаю, как получать биграммы и триграммы, используя NLTK, и я применяю их к своим собственным корпусам. Код ниже. Однако я не уверен насчет (1), как получить словосочетания для конкретного слова? (2) имеет ли NLTK метрику коллокации на основе ...
Токенизация юникода с использованием nltk
У меня есть текстовые файлы, использующие кодировку utf-8 и содержащие такие символы, как 'ö', 'ü' и т. Д. Я хотел бы проанализировать текст этих файлов, но я не могу заставить токенайзер работать должным образом. Если я использую стандартный ...
NLTK считает, что императивы являются существительными
Я использую pos_tagger на рецептах. У меня проблема в том, что pos_tagger возвращает, что слова в императивном времени являются существительными, не должны ли они быть глаголами? Например: С входом: combine 1 1/2 cups floud, 3/4 cup sugar, salt ...