Результаты поиска по запросу "corpus"

2 ответа

Как выбрать только подмножество корпусных терминов для создания TermDocumentMatrix в TM

3 ответа

Поиск набора данных для проверки поиска в стиле FULLTEXT на [закрыто]

Я ищу набор текста для запуска пробного поиска данных в полнотекстовом стиле. Либо что-то, что я могу скачать, или система, которая генерирует это. Что-то бо...

3 ответа

Как я могу распечатать все содержимое Wordnet (желательно с NLTK)?

NLTK предоставляет функции для печати всех слов в корпусе Брауна (или Гутенберга). Но эквивалентная функция, похоже, не работает в Wordnet.Есть ли способ сде...

ТОП публикаций

2 ответа

Аналогичный метод из модуля nltk дает разные результаты на разных машинах. Зачем?

Я преподавал несколько вводных классов для анализа текста с помощью Python, и класс попробовал аналогичный метод с предоставленными учебными текстами. Некото...

1 ответ

Как превратить список в корпус в r?

В этомвопрос Я спросил, как разбить огромный массив данных, чтобы создать корпус. Благодаря ответу я смог создать список из данных. Моя проблема была ещеполу...

3 ответа

Нужен бесплатный словарь английского языка или корпус, в конечном итоге для базы данных MySQL [закрыто]

Я пытаюсь найти бесплатный загружаемый словарь (или «Корпус» - лучшее слово), который я могу импортировать в MySQL. Мне нужно, чтобы слова имели тип (существительное, глагол, прилагательное), связанный с ними. Любые советы о том, где я могу найти ...

3 ответа

Снимает некоторые проблемы для языка девнагари.

тал, что ответом на мой заголовок часто является чтение документации, но я пробежал поНЛТК книга [http://www.nltk.org/book]но это не дает ответа. Я немного новичок в питоне. У меня есть куча.txt файлы, и я хочу иметь возможность использовать ...

1 ответ

мне удалось закодировать его в NLTK. я должен разбить каждое предложение на новую строку. Благодарю. затем выполните эту команду ht.tag (file.readline (). split ())

кто-нибудь помочь мне с синтаксисом hunpos, помечающим корпус в nltk? Что я импортирую дляhunpos.HunPosTagger модуль [http://nltk.googlecode.com/svn/trunk/doc/api/nltk.tag.hunpos.HunposTagger-class.html] ? Как мне HunPosTag корпус? Смотрите ...

1 ответ

Хороший способ отслеживать, какой фрагмент текста принадлежит какому файлу. Это также делает такие вещи, как настроение или анализ любого другого типа, простым на уровне документа.

я есть список HTML-файлов, я взял некоторые тексты из Интернета и заставил их читать сread_html. Мои имена файлов похожи на: a1 <- read_html(link of the text) a2 <- read_html(link of the text) . . . ## until: a100 <- read_html(link of the ...

4 ответа

 Кроме того, пришли код, чтобы проверить, есть ли файлы там.

роект использует NLTK. Как я могу перечислить требования к корпусу и модели проекта, чтобы они могли быть автоматически установлены? Я не хочу нажимать наnltk.download() GUI, установка пакетов один за другим. Кроме того, любой способ заморозить ...