Результаты поиска по запросу "nlp"

2 ответа

Python и NLTK: как анализировать грамматику предложений?

У меня есть этот код, который должен показать синтаксическую структуру предложения в соответствии с определенной грамматикой. Однако он возвращает пустой []. Что я пропускаю или делаю неправильно? import nltk grammar = nltk.parse_cfg(""" S -> NP ...

1 ответ

Как я могу добавить больше языков к стоп-словам в NLTK?

Я использую NLTK со стоп-словами для определения языка документа, используя метод, описанный Алехандро Ноллой ...

2 ответа

Самый эффективный способ индексировать слова в документе?

Это возникло в другом вопросе, но я решил, что лучше задать это как отдельный вопрос. Дайте большой список предложений (порядка 100 тысяч): [ "This is sentence 1 as an example", "This is sentence 1 as another example", "This is sentence 2", ...

ТОП публикаций

2 ответа

Алгоритмы семантической связанности - python [закрыто]

Я хочу найти взаимосвязь между двумя синтаксисами, и я наткнулся на множество алгоритмов, таких как resnik, lin, wu palmer, алгоритм пути, leacock chodorow и т. Д. Может кто-нибудь сказать мне, какой из этих алгоритмов наиболее эффективен?

1 ответ

Как сформировать вектор признаков для классификатора, нацеленного на распознавание именованных объектов?

У меня есть набор тегов (отличается от обычного имени, места, объекта и т. Д.). В моем случае они зависят от домена, и я называю их: сущность, действие, инцидент. Я хочу использовать их как семя для извлечения большего количества именованных ...

3 ответа

Как мне подойти к этой задаче классификации именованных объектов?

Я задаю связанный вопросВот [https://stackoverflow.com/questions/8219772/how-do-i-form-a-feature-vector-for-a-classifier-targeted-at-named-entity-recogni] но этот вопрос носит более общий характер. Я взял большую корпорацию и прокомментировал ...

3 ответа

База данных спряжения глаголов [закрыто]

Кто-нибудь знает хорошую базу данных для спряжения глаголов? Я создаю приложение для обработки естественного языка. Хотя я смог широко использовать WordNet, он не позволяет мне проверять форму глагола в базе данных спряжения или спрягать другие ...

1 ответ

НЛП фреймворк для .NET [закрыто]

Я нашел ссылки на SharpNLP (порт OpenNLP на основе Java) и Antelope от Proxem. Я пытаюсь создать полное дерево разбора предложения (пометку части речи), а также поиск имени для дат / времени и местоположений. Библиотека SharpNLP, по-видимому, ...

5 ответов

Что тэггер NLTK POS просит меня скачать?

Я только начал использовать тегер части речи, и у меня много проблем. Я начал маркировку POS со следующего: import nltk text=nltk.word_tokenize("We are going out.Just you and me.")Когда я хочу напечатать'text'происходит следующее: print ...

1 ответ

формат обучающих данных для nltk punkt

Я хотел бы запустить nltk punkt, чтобы разделить предложения. Модели тренировок нет, поэтому я тренирую модель отдельно, но я не уверен, что формат данных обучения, который я использую, правильный. Мои тренировочные данные - одно предложение на ...