Результаты поиска по запросу "corpus"
Поиск набора данных для проверки поиска в стиле FULLTEXT на [закрыто]
Я ищу набор текста для запуска пробного поиска данных в полнотекстовом стиле. Либо что-то, что я могу скачать, или система, которая генерирует это. Что-то бо...
Как я могу распечатать все содержимое Wordnet (желательно с NLTK)?
NLTK предоставляет функции для печати всех слов в корпусе Брауна (или Гутенберга). Но эквивалентная функция, похоже, не работает в Wordnet.Есть ли способ сде...
Аналогичный метод из модуля nltk дает разные результаты на разных машинах. Зачем?
Я преподавал несколько вводных классов для анализа текста с помощью Python, и класс попробовал аналогичный метод с предоставленными учебными текстами. Некото...
Как превратить список в корпус в r?
В этомвопрос Я спросил, как разбить огромный массив данных, чтобы создать корпус. Благодаря ответу я смог создать список из данных. Моя проблема была ещеполу...
Нужен бесплатный словарь английского языка или корпус, в конечном итоге для базы данных MySQL [закрыто]
Я пытаюсь найти бесплатный загружаемый словарь (или «Корпус» - лучшее слово), который я могу импортировать в MySQL. Мне нужно, чтобы слова имели тип (существительное, глагол, прилагательное), связанный с ними. Любые советы о том, где я могу найти ...
Снимает некоторые проблемы для языка девнагари.
тал, что ответом на мой заголовок часто является чтение документации, но я пробежал поНЛТК книга [http://www.nltk.org/book]но это не дает ответа. Я немного новичок в питоне. У меня есть куча.txt файлы, и я хочу иметь возможность использовать ...
мне удалось закодировать его в NLTK. я должен разбить каждое предложение на новую строку. Благодарю. затем выполните эту команду ht.tag (file.readline (). split ())
кто-нибудь помочь мне с синтаксисом hunpos, помечающим корпус в nltk? Что я импортирую дляhunpos.HunPosTagger модуль [http://nltk.googlecode.com/svn/trunk/doc/api/nltk.tag.hunpos.HunposTagger-class.html] ? Как мне HunPosTag корпус? Смотрите ...
Хороший способ отслеживать, какой фрагмент текста принадлежит какому файлу. Это также делает такие вещи, как настроение или анализ любого другого типа, простым на уровне документа.
я есть список HTML-файлов, я взял некоторые тексты из Интернета и заставил их читать сread_html. Мои имена файлов похожи на: a1 <- read_html(link of the text) a2 <- read_html(link of the text) . . . ## until: a100 <- read_html(link of the ...
Кроме того, пришли код, чтобы проверить, есть ли файлы там.
роект использует NLTK. Как я могу перечислить требования к корпусу и модели проекта, чтобы они могли быть автоматически установлены? Я не хочу нажимать наnltk.download() GUI, установка пакетов один за другим. Кроме того, любой способ заморозить ...