Результаты поиска по запросу "nltk"
считая n-граммовую частоту в питоне nltk
У меня есть следующий код. Я знаю, что я могу использоватьapply_freq_filter функция для фильтрации коллокаций, которые меньше, чем счетчик частоты. Однако я не знаю, как получить частоты всех n-граммовых кортежей (в моем случае bi-грамм) в ...
Преобразование слов между формами глагол / существительное / прилагательное
Я хотел бы функцию библиотеки Python, которая переводит / конвертирует в разных частях речи. иногда он должен выводить несколько слов (например, «кодер» и «код» являются существительными от глагола «кодировать», один - субъект, другой ...
NLTK POS tagger не работает
Если я попробую это: import nltk text = nltk.word_tokenize("And now for something completely different") nltk.pos_tag(text)Выход: Traceback (most recent call last): File "C:/Python27/pos.py", line 3, in <module> nltk.pos_tag(text) ...
Классифицирующий интерфейс НЛТК с использованием обученного классификатора
У меня есть этот маленький кусок кода, который я нашелВот [http://streamhacker.com/2010/05/10/text-classification-sentiment-analysis-naive-bayes-classifier/] : import nltk.classify.util from nltk.classify import NaiveBayesClassifier ...
NLTK Пометка испанских слов с помощью корпуса
Я пытаюсь научиться помечать испанские слова, используя NLTK. ИзНЛТК книга [http://nltk.org/book/ch05.html]Это довольно легко пометить английские слова, используя их пример. Поскольку я новичок в nltk и во всех языковых обработках, я совершенно ...
CFG с использованием POS-тегов в NLTK [закрыто]
Я пытаюсь проверить, является ли данное предложениеграмматический используя NLTK. Пример: ОК: кит лижет печаль НЕ ОК: лучшее, что я когда-либо имел Я знаю, что мог бы сделать POS-тегирование, затем использовать синтаксический анализатор CFG и ...
Как избавиться от пунктуации с помощью токенайзера NLTK?
Я только начинаю использовать NLTK, и я не совсем понимаю, как получить список слов из текста. Если я используюnltk.word_tokenize()Я получаю список слов и знаков препинания. Мне нужны только слова вместо. Как я могу избавиться от пунктуации? ...
лемматизация в Wordnet и теги pos в python
Я хотел использовать лемматизатор wordnet в python, и я узнал, что по умолчанию тэг pos равен NOUN и что он не выводит правильную лемму для глагола, если тэг pos явно не указан как VERB. У меня вопрос, какой метод лучше всего подходит для точной ...
эффективная матрица срочных документов с NLTK
Я пытаюсь создать матрицу срочных документов с NLTK и пандами. Я написал следующую функцию: def fnDTM_Corpus(xCorpus): import pandas as pd '''to create a Term Document Matrix from a NLTK Corpus''' fd_list = [] for x in ...