Resultados da pesquisa a pedido "nlp"
Como extrair substantivos usando NLTK pos_tag ()?
Eu sou bastante novo para python. Eu não sou capaz de descobrir o bug. Eu quero extrair substantivos usando NLTK. Eu escrevi o seguinte código: import nltk sentence = "At eight o'clock on Thursday film morning word line test best beautiful Ram ...
Escrevendo nossos próprios modelos em openNLP
Se eu usar uma consulta como esta na linha de comando ./opennlp TokenNameFinder en-ner-person.bin "input.txt" "output.txt"Vou obter nomes de pessoas impressos em output.txt, mas quero escrever modelos próprios para que eu imprima minhas próprias ...
Reconhecimento de entidade nomeada com expressão regular: NLTK
Eu tenho jogado com o kit de ferramentas NLTK. Me deparei muito com esse problema e procurei a solução on-line, mas em nenhum lugar obtive uma resposta satisfatória. Então, eu estou colocando minha consulta aqui. Muitas vezes, o NER não ...
Como extrair frases comuns / significativas de uma série de entradas de texto
Eu tenho uma série de itens de texto - HTML bruto de um banco de dados MySQL. Desejo encontrar as frases mais comuns nessas entradas (não a frase mais comum e, idealmente, não aplicando a correspondência palavra por palavra). Meu exemplo é ...
Atualizando os nomes dos recursos no scikit TFIdfVectorizer
Estou testando este código from sklearn.feature_extraction.text import TfidfVectorizer import numpy as np train_data = ["football is the sport","gravity is the movie", "education is imporatant"] vectorizer = TfidfVectorizer(sublinear_tf=True, ...
Algoritmo de extração de frase para tradução automática estatística
Eu escrevi o seguinte código com o algoritmo de extração de frase para SMT. GitHub [https://github.com/alvations/nltk/blob/develop/nltk/align/phrase_based.py] # -*- coding: utf-8 -*- def phrase_extraction(srctext, trgtext, alignment): ...
NLTK WordNet Lemmatizer: Não deveria lematizar todas as flexões de uma palavra?
Estou usando o NLTK WordNet Lemmatizer para um projeto de marcação com parte do discurso, modificando primeiro cada palavra do corpus de treinamento em seu radical (modificação no local) e depois treinando apenas no novo corpus. No entanto, ...
existem bibliotecas c # para a Named Entity Re, cognição? [fechadas]
Estou procurando por bibliotecas gratuitas para reconhecimento de entidade nomeada em c # ou qualquer outra linguagem .net.
Python - RegEx para dividir texto em frases (tokenizing de frase) [duplicado]
Esta pergunta já tem uma resposta aqui: Python dividir texto em frases [/questions/4576077/python-split-text-on-sentences] 9 respostasQuero fazer uma lista de frases de uma string e imprimi-las. Não quero usar o NLTK para fazer isso. Portanto, ...
Extração de cláusulas usando o analisador Stanford
Eu tenho uma frase complexa e preciso separá-la na cláusula principal e na dependente. Por exemplo para a frase A ABC cita o fato de que os aditivos químicos são proibidos em muitos países e considera que também podem ser proibidos nesse ...