Результаты поиска по запросу "nltk"
Спасибо, у меня есть два вопроса, что если я хочу использовать «биграммы», а не «каждыйграммы» для обучения и тестирования? и что, если я хочу вычислить недоумение для всех предложений? Должен ли я получить среднее из недоразумений?
тируюperplexity мера для языковой модели для текста: train_sentences = nltk.sent_tokenize(train_text) test_sentences = nltk.sent_tokenize(test_text) train_tokenized_text = [list(map(str.lower, nltk.tokenize.word_tokenize(sent))) for sent in ...
Большое спасибо alvas. Это помогает.
емые участники сообщества! Во время предварительной обработки данных, после разделения raw_data на токены, я использовал популярный WordNet Lemmatizer для генерации основ. Я выполняю эксперименты с набором данных, который имеет 18953 ...
@alvas Я согласен. Но тогда я знал, знаю другое место, где это можно было бы спросить. На самом деле не знал о проблеме (только видел ваш ответ). Я думал, что это была ошибка / интенциональные особенности во внутренней работе НЛТК
аюсь лемматизировать все слова в предложении с помощью WordNetLemmatizer NLTK. У меня есть несколько предложений, но я просто использую первое предложение, чтобы убедиться, что я делаю это правильно. Вот что у меня есть: train_sentences[0] ...
Python: tf-idf-cosine: найти сходство документа
Я следовал учебнику, который был доступен наЧасть 1 & Амп;Часть 2, К сожалению, у автора не было времени для заключительного раздела, в котором использовалос...
Пожалуйста, смотрите редактировать 3.
ерен определить структуру предложения на английском языке, используя spacy и textacy. Например: кот сидел на коврике - SVO, кот прыгнул и поднял печенье - SVV0. Кот съел печенье и печенье. - СВОО. Предполагается, что программа читает абзац и ...
Код:
ющий код распечатываетleaf: from nltk.stem.wordnet import WordNetLemmatizer lem = WordNetLemmatizer() print(lem.lemmatize('leaves'))Это может быть или не быть точным в зависимости от окружающего контекста, например,Mary leaves the room противDew ...
Вот мой вывод:
аюсь реализовать код для проверки погодных условий в конкретной области, используя OpenWeatherMap API и NLTK, чтобы найти распознавание имени объекта. Но я не могу найти способ передачи сущности, присутствующей в GPE (которая ...
результаты: Положительные: 0,7142857142857143 Отрицательные: 0,14285714285714285
ервый раз, когда я строю модель машинного обучения для анализа настроений, используя nltk NaiveBayesClassifier в Python. Я знаю, что это слишком простая модель, но для меня это только первый шаг, и в следующий раз я попробую токенизированные ...
stackoverflow.com/questions/41674573/...
аюсь выполнить функцию с миллионами строк в наборах данных. Я читаю данные из CSV в кадре данныхЯ использую выпадающий список, чтобы удалить данные, которые мне не нужныЯ передаю его через функцию NLTK в цикле for.код: def nlkt(val): ...
немного изменить данные в
я есть таблица, как показано ниже: URN Firm_Name 0 104472 R.X. Yah & Co 1 104873 Big Building Society 2 109986 St James's Society 3 114058 The Kensington Society Ltd 4 113438 MMV Oil Associates LtdИ я хочу посчитать частоту всех слов в столбце ...