Результаты поиска по запросу "nlp"
Python и NLTK: как анализировать грамматику предложений?
У меня есть этот код, который должен показать синтаксическую структуру предложения в соответствии с определенной грамматикой. Однако он возвращает пустой []. Что я пропускаю или делаю неправильно? import nltk grammar = nltk.parse_cfg(""" S -> NP ...
Как я могу добавить больше языков к стоп-словам в NLTK?
Я использую NLTK со стоп-словами для определения языка документа, используя метод, описанный Алехандро Ноллой ...
Самый эффективный способ индексировать слова в документе?
Это возникло в другом вопросе, но я решил, что лучше задать это как отдельный вопрос. Дайте большой список предложений (порядка 100 тысяч): [ "This is sentence 1 as an example", "This is sentence 1 as another example", "This is sentence 2", ...
Алгоритмы семантической связанности - python [закрыто]
Я хочу найти взаимосвязь между двумя синтаксисами, и я наткнулся на множество алгоритмов, таких как resnik, lin, wu palmer, алгоритм пути, leacock chodorow и т. Д. Может кто-нибудь сказать мне, какой из этих алгоритмов наиболее эффективен?
Как сформировать вектор признаков для классификатора, нацеленного на распознавание именованных объектов?
У меня есть набор тегов (отличается от обычного имени, места, объекта и т. Д.). В моем случае они зависят от домена, и я называю их: сущность, действие, инцидент. Я хочу использовать их как семя для извлечения большего количества именованных ...
Как мне подойти к этой задаче классификации именованных объектов?
Я задаю связанный вопросВот [https://stackoverflow.com/questions/8219772/how-do-i-form-a-feature-vector-for-a-classifier-targeted-at-named-entity-recogni] но этот вопрос носит более общий характер. Я взял большую корпорацию и прокомментировал ...
База данных спряжения глаголов [закрыто]
Кто-нибудь знает хорошую базу данных для спряжения глаголов? Я создаю приложение для обработки естественного языка. Хотя я смог широко использовать WordNet, он не позволяет мне проверять форму глагола в базе данных спряжения или спрягать другие ...
НЛП фреймворк для .NET [закрыто]
Я нашел ссылки на SharpNLP (порт OpenNLP на основе Java) и Antelope от Proxem. Я пытаюсь создать полное дерево разбора предложения (пометку части речи), а также поиск имени для дат / времени и местоположений. Библиотека SharpNLP, по-видимому, ...
Что тэггер NLTK POS просит меня скачать?
Я только начал использовать тегер части речи, и у меня много проблем. Я начал маркировку POS со следующего: import nltk text=nltk.word_tokenize("We are going out.Just you and me.")Когда я хочу напечатать'text'происходит следующее: print ...
формат обучающих данных для nltk punkt
Я хотел бы запустить nltk punkt, чтобы разделить предложения. Модели тренировок нет, поэтому я тренирую модель отдельно, но я не уверен, что формат данных обучения, который я использую, правильный. Мои тренировочные данные - одно предложение на ...