Результаты поиска по запросу "nlp"

3 ответа

Каков относительно простой способ определить вероятность того, что предложение написано на английском языке?

У меня есть несколько строк (наборов символов), которые представляют предложения на разных языках, скажем: Здравствуйте, меня зовут Джордж. Das brot ist gut. ... и т.д. Я хочу присвоить каждому из них баллы (от 0 до 1), указывающие на ...

1 ответ

CFG с использованием POS-тегов в NLTK [закрыто]

Я пытаюсь проверить, является ли данное предложениеграмматический используя NLTK. Пример: ОК: кит лижет печаль НЕ ОК: лучшее, что я когда-либо имел Я знаю, что мог бы сделать POS-тегирование, затем использовать синтаксический анализатор CFG и ...

9 ответов

Как распечатать модели тем LDA от Gensim? питон

С помощьюgensim Мне удалось извлечь темы из набора документов в LSA, но как мне получить доступ к темам, сгенерированным из моделей LDA? При печатиlda.print_topics(10) код дал следующую ошибку, потому чтоprint_topics() ...

ТОП публикаций

1 ответ

Получение OOM при использовании GATE на большом наборе данных

Я новичок в НЛП и использую GATE для него. Я получаю OOM Exception, если я запускаю свой код для большого набора данных (содержащего 7K + записей). Ниже приведен код, где происходит исключение. /** * Run ANNIE * * @param controller * @throws ...

5 ответов

Рассчитать косинусное сходство по 2 строкам предложения

ИзPython: tf-idf-cosine: найти сходство документа [https://stackoverflow.com/questions/12118720/python-tf-idf-cosine-to-find-document-similarity] , можно рассчитать сходство документов, используя косинус tf-idf. Без импорта внешних библиотек, ...

4 ответа

Необслуживаемые алгоритмы автоматической пометки?

Я хочу создать веб-приложение, которое позволяет пользователям загружатьдокументы, ролики, картинки, Музыка, а затем дать им возможность искать их. Думайте об этом какDropbox + Семантический поиск. Когда пользователь загружает новый файл, ...

2 ответа

Установка TreeTagger прошла успешно, но не удается открыть файл .par

Кто-нибудь знает, как решить эту ошибку чтения файла вTreeTagger это обычный инструмент для обработки естественного языка, используемый дляPOS тег, лемматизировать и куски предложения? alvas@ikoma:~/treetagger$ echo 'Hello world!' | ...

8 ответов

Как избавиться от пунктуации с помощью токенайзера NLTK?

Я только начинаю использовать NLTK, и я не совсем понимаю, как получить список слов из текста. Если я используюnltk.word_tokenize()Я получаю список слов и знаков препинания. Мне нужны только слова вместо. Как я могу избавиться от пунктуации? ...

0 ответов

Stanford Core NLP как получить вероятность и погрешность

При использовании синтаксического анализатора или, по сути, любой аннотации в Core NLP, есть ли способ получить доступ к вероятности или пределу погрешности? Чтобы поставить мой вопрос в контекст, я пытаюсь понять, есть ли программный способ ...

3 ответа

Как вычислить сходство частот букв?

Учитывая эти данные (относительная частота букв на обоих языках): spanish => 'e' => 13.72, 'a' => 11.72, 'o' => 8.44, 's' => 7.20, 'n' => 6.83, english => 'e' => 12.60, 't' => 9.37, 'a' => 8.34, 'o' => 7.70, 'n' => 6.80,А затем вычисление ...