Результаты поиска по запросу "nltk"

1 ответ

Как я могу добавить больше языков к стоп-словам в NLTK?

Я использую NLTK со стоп-словами для определения языка документа, используя метод, описанный Алехандро Ноллой ...

2 ответа

Алгоритмы семантической связанности - python [закрыто]

Я хочу найти взаимосвязь между двумя синтаксисами, и я наткнулся на множество алгоритмов, таких как resnik, lin, wu palmer, алгоритм пути, leacock chodorow и т. Д. Может кто-нибудь сказать мне, какой из этих алгоритмов наиболее эффективен?

3 ответа

Как мне подойти к этой задаче классификации именованных объектов?

Я задаю связанный вопросВот [https://stackoverflow.com/questions/8219772/how-do-i-form-a-feature-vector-for-a-classifier-targeted-at-named-entity-recogni] но этот вопрос носит более общий характер. Я взял большую корпорацию и прокомментировал ...

ТОП публикаций

1 ответ

Создание и использование StanfordTagger в NLTK

Я прошу прощения за новичок в этом вопросе - я пытался выяснить, как Python упаковывает пространство имен, но тонкости, кажется, ускользают от меня. Я бы хотел использовать оболочку Python для тега части речи Стэнфорда. У меня не было проблем с ...

1 ответ

формат обучающих данных для nltk punkt

Я хотел бы запустить nltk punkt, чтобы разделить предложения. Модели тренировок нет, поэтому я тренирую модель отдельно, но я не уверен, что формат данных обучения, который я использую, правильный. Мои тренировочные данные - одно предложение на ...

5 ответов

Что тэггер NLTK POS просит меня скачать?

Я только начал использовать тегер части речи, и у меня много проблем. Я начал маркировку POS со следующего: import nltk text=nltk.word_tokenize("We are going out.Just you and me.")Когда я хочу напечатать'text'происходит следующее: print ...

1 ответ

Использование моего собственного корпуса для классификации категорий в Python NLTK

Я новичок в NTLK / Python и мне удалось загрузить свой собственный корпус с помощью CategoryorizedPlaintextCorpusReader, но как мне на самом деле обучать и использовать данные для классификации текста? >>> from nltk.corpus.reader import ...

3 ответа

NLTK словосочетания для конкретных слов

Я знаю, как получать биграммы и триграммы, используя NLTK, и я применяю их к своим собственным корпусам. Код ниже. Однако я не уверен насчет (1), как получить словосочетания для конкретного слова? (2) имеет ли NLTK метрику коллокации на основе ...

3 ответа

Токенизация юникода с использованием nltk

У меня есть текстовые файлы, использующие кодировку utf-8 и содержащие такие символы, как 'ö', 'ü' и т. Д. Я хотел бы проанализировать текст этих файлов, но я не могу заставить токенайзер работать должным образом. Если я использую стандартный ...

0 ответов

NLTK считает, что императивы являются существительными

Я использую pos_tagger на рецептах. У меня проблема в том, что pos_tagger возвращает, что слова в императивном времени являются существительными, не должны ли они быть глаголами? Например: С входом: combine 1 1/2 cups floud, 3/4 cup sugar, salt ...