Результаты поиска по запросу "nltk"

3 ответа

считая n-граммовую частоту в питоне nltk

У меня есть следующий код. Я знаю, что я могу использоватьapply_freq_filter функция для фильтрации коллокаций, которые меньше, чем счетчик частоты. Однако я не знаю, как получить частоты всех n-граммовых кортежей (в моем случае bi-грамм) в ...

4 ответа

Преобразование слов между формами глагол / существительное / прилагательное

Я хотел бы функцию библиотеки Python, которая переводит / конвертирует в разных частях речи. иногда он должен выводить несколько слов (например, «кодер» и «код» являются существительными от глагола «кодировать», один - субъект, другой ...

1 ответ

NLTK POS tagger не работает

Если я попробую это: import nltk text = nltk.word_tokenize("And now for something completely different") nltk.pos_tag(text)Выход: Traceback (most recent call last): File "C:/Python27/pos.py", line 3, in <module> nltk.pos_tag(text) ...

ТОП публикаций

1 ответ

Классифицирующий интерфейс НЛТК с использованием обученного классификатора

У меня есть этот маленький кусок кода, который я нашелВот [http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/] : import nltk.classify.util from nltk.classify import NaiveBayesClassifier ...

3 ответа

NLTK Пометка испанских слов с помощью корпуса

Я пытаюсь научиться помечать испанские слова, используя NLTK. ИзНЛТК книга [http://nltk.org/book/ch05.html]Это довольно легко пометить английские слова, используя их пример. Поскольку я новичок в nltk и во всех языковых обработках, я совершенно ...

1 ответ

CFG с использованием POS-тегов в NLTK [закрыто]

Я пытаюсь проверить, является ли данное предложениеграмматический используя NLTK. Пример: ОК: кит лижет печаль НЕ ОК: лучшее, что я когда-либо имел Я знаю, что мог бы сделать POS-тегирование, затем использовать синтаксический анализатор CFG и ...

8 ответов

Как избавиться от пунктуации с помощью токенайзера NLTK?

Я только начинаю использовать NLTK, и я не совсем понимаю, как получить список слов из текста. Если я используюnltk.word_tokenize()Я получаю список слов и знаков препинания. Мне нужны только слова вместо. Как я могу избавиться от пунктуации? ...

6 ответов

лемматизация в Wordnet и теги pos в python

Я хотел использовать лемматизатор wordnet в python, и я узнал, что по умолчанию тэг pos равен NOUN и что он не выводит правильную лемму для глагола, если тэг pos явно не указан как VERB. У меня вопрос, какой метод лучше всего подходит для точной ...

3 ответа

эффективная матрица срочных документов с NLTK

Я пытаюсь создать матрицу срочных документов с NLTK и пандами. Я написал следующую функцию: def fnDTM_Corpus(xCorpus): import pandas as pd '''to create a Term Document Matrix from a NLTK Corpus''' fd_list = [] for x in ...