Resultados da pesquisa a pedido "nlp"

4 a resposta

Como extrair substantivos usando NLTK pos_tag ()?

Eu sou bastante novo para python. Eu não sou capaz de descobrir o bug. Eu quero extrair substantivos usando NLTK. Eu escrevi o seguinte código: import nltk sentence = "At eight o'clock on Thursday film morning word line test best beautiful Ram ...

1 a resposta

Escrevendo nossos próprios modelos em openNLP

Se eu usar uma consulta como esta na linha de comando ./opennlp TokenNameFinder en-ner-person.bin "input.txt" "output.txt"Vou obter nomes de pessoas impressos em output.txt, mas quero escrever modelos próprios para que eu imprima minhas próprias ...

3 a resposta

Reconhecimento de entidade nomeada com expressão regular: NLTK

Eu tenho jogado com o kit de ferramentas NLTK. Me deparei muito com esse problema e procurei a solução on-line, mas em nenhum lugar obtive uma resposta satisfatória. Então, eu estou colocando minha consulta aqui. Muitas vezes, o NER não ...

4 a resposta

Como extrair frases comuns / significativas de uma série de entradas de texto

Eu tenho uma série de itens de texto - HTML bruto de um banco de dados MySQL. Desejo encontrar as frases mais comuns nessas entradas (não a frase mais comum e, idealmente, não aplicando a correspondência palavra por palavra). Meu exemplo é ...

2 a resposta

Atualizando os nomes dos recursos no scikit TFIdfVectorizer

Estou testando este código from sklearn.feature_extraction.text import TfidfVectorizer import numpy as np train_data = ["football is the sport","gravity is the movie", "education is imporatant"] vectorizer = TfidfVectorizer(sublinear_tf=True, ...

0 a resposta

Algoritmo de extração de frase para tradução automática estatística

Eu escrevi o seguinte código com o algoritmo de extração de frase para SMT. GitHub [https://github.com/alvations/nltk/blob/develop/nltk/align/phrase_based.py] # -*- coding: utf-8 -*- def phrase_extraction(srctext, trgtext, alignment): ...

4 a resposta

NLTK WordNet Lemmatizer: Não deveria lematizar todas as flexões de uma palavra?

Estou usando o NLTK WordNet Lemmatizer para um projeto de marcação com parte do discurso, modificando primeiro cada palavra do corpus de treinamento em seu radical (modificação no local) e depois treinando apenas no novo corpus. No entanto, ...

3 a resposta

existem bibliotecas c # para a Named Entity Re, cognição? [fechadas]

Estou procurando por bibliotecas gratuitas para reconhecimento de entidade nomeada em c # ou qualquer outra linguagem .net.

10 a resposta

Python - RegEx para dividir texto em frases (tokenizing de frase) [duplicado]

Esta pergunta já tem uma resposta aqui: Python dividir texto em frases [/questions/4576077/python-split-text-on-sentences] 9 respostasQuero fazer uma lista de frases de uma string e imprimi-las. Não quero usar o NLTK para fazer isso. Portanto, ...

1 a resposta

Extração de cláusulas usando o analisador Stanford

Eu tenho uma frase complexa e preciso separá-la na cláusula principal e na dependente. Por exemplo para a frase A ABC cita o fato de que os aditivos químicos são proibidos em muitos países e considera que também podem ser proibidos nesse ...