Результаты поиска по запросу "nltk"

1 ответ

Спасибо, у меня есть два вопроса, что если я хочу использовать «биграммы», а не «каждыйграммы» для обучения и тестирования? и что, если я хочу вычислить недоумение для всех предложений? Должен ли я получить среднее из недоразумений?

тируюperplexity мера для языковой модели для текста: train_sentences = nltk.sent_tokenize(train_text) test_sentences = nltk.sent_tokenize(test_text) train_tokenized_text = [list(map(str.lower, nltk.tokenize.word_tokenize(sent))) for sent in ...

1 ответ

Большое спасибо alvas. Это помогает.

емые участники сообщества! Во время предварительной обработки данных, после разделения raw_data на токены, я использовал популярный WordNet Lemmatizer для генерации основ. Я выполняю эксперименты с набором данных, который имеет 18953 ...

2 ответа

@alvas Я согласен. Но тогда я знал, знаю другое место, где это можно было бы спросить. На самом деле не знал о проблеме (только видел ваш ответ). Я думал, что это была ошибка / интенциональные особенности во внутренней работе НЛТК

аюсь лемматизировать все слова в предложении с помощью WordNetLemmatizer NLTK. У меня есть несколько предложений, но я просто использую первое предложение, чтобы убедиться, что я делаю это правильно. Вот что у меня есть: train_sentences[0] ...

ТОП публикаций

6 ответов

Python: tf-idf-cosine: найти сходство документа

Я следовал учебнику, который был доступен наЧасть 1 & Амп;Часть 2, К сожалению, у автора не было времени для заключительного раздела, в котором использовалос...

1 ответ

Пожалуйста, смотрите редактировать 3.

ерен определить структуру предложения на английском языке, используя spacy и textacy. Например: кот сидел на коврике - SVO, кот прыгнул и поднял печенье - SVV0. Кот съел печенье и печенье. - СВОО. Предполагается, что программа читает абзац и ...

0 ответов

Код:

ющий код распечатываетleaf: from nltk.stem.wordnet import WordNetLemmatizer lem = WordNetLemmatizer() print(lem.lemmatize('leaves'))Это может быть или не быть точным в зависимости от окружающего контекста, например,Mary leaves the room противDew ...

1 ответ

Вот мой вывод:

аюсь реализовать код для проверки погодных условий в конкретной области, используя OpenWeatherMap API и NLTK, чтобы найти распознавание имени объекта. Но я не могу найти способ передачи сущности, присутствующей в GPE (которая ...

4 ответа

результаты: Положительные: 0,7142857142857143 Отрицательные: 0,14285714285714285

ервый раз, когда я строю модель машинного обучения для анализа настроений, используя nltk NaiveBayesClassifier в Python. Я знаю, что это слишком простая модель, но для меня это только первый шаг, и в следующий раз я попробую токенизированные ...

1 ответ

stackoverflow.com/questions/41674573/...

аюсь выполнить функцию с миллионами строк в наборах данных. Я читаю данные из CSV в кадре данныхЯ использую выпадающий список, чтобы удалить данные, которые мне не нужныЯ передаю его через функцию NLTK в цикле for.код: def nlkt(val): ...

2 ответа

 немного изменить данные в

я есть таблица, как показано ниже: URN Firm_Name 0 104472 R.X. Yah & Co 1 104873 Big Building Society 2 109986 St James's Society 3 114058 The Kensington Society Ltd 4 113438 MMV Oil Associates LtdИ я хочу посчитать частоту всех слов в столбце ...