Resultados da pesquisa a pedido "pos-tagger"

2 a resposta

Como POS_TAG uma frase em francês?

Estou procurando uma maneira depos_tag uma frase em francês como o código a seguir é usada para frases em inglês: def pos_tagging(sentence): var = sentence exampleArray = [var] for item in exampleArray: tokenized = nltk.word_tokenize(item) ...

3 a resposta

Como aplicar pos_tag_sents () ao dataframe do pandas com eficiência

Nas situações em que você deseja marcar com tag uma coluna de texto armazenada em um dataframe do pandas com 1 frase por linha, a maioria das implementações no SO usa o método apply dfData['POSTags']= dfData['SourceText'].apply( lamda ...

5 a resposta

corresponder à tag POS e sequência de palavras

Eu tenho as seguintes duas strings com suas tags POS: Sent1: "algo como o trabalho do escritor profissional ou fraseologia seria muito legal." [('something', 'NN'), ('like', 'IN'), ('how', 'WRB'), ('writer', 'NN'), ('pro', 'NN') , ('ou', 'CC'), ...

1 a resposta

detecção de padrão de tag POS junto com palavras especificadas

Preciso identificar determinadas tags POS antes / depois de certas palavras especificadas, por exemplo, a seguinte frase com tag: [('This', 'DT'), ('feature', 'NN'), ('would', 'MD'), ('be', 'VB'), ('nice', 'JJ'), ('to', 'TO'), ('have', ...

2 a resposta

nltk StanfordNERTagger: Como obter nomes próprios sem letras maiúsculas

Estou tentando usar o StanfordNERTagger e o nltk para extrair palavras-chave de um pedaço de texto. docText="John Donk works for POI. Brian Jones wants to meet with Xyz Corp. for measuring POI's Short Term performance Metrics." words = ...

3 a resposta

O POS-Tagger é incrivelmente lento

estou usandonltk para gerar n-gramas a partir de sentenças removendo primeiro as palavras de parada especificadas. Contudo,nltk.pos_tag() é extremamente lento, levando até 0,6 segundos na minha CPU (Intel i7). A saída: ['The first time I went, ...

3 a resposta

Como usar o OpenNLP para obter tags POS no R?

Aqui está o código R: library(NLP) library(openNLP) tagPOS <- function(x, ...) { s <- as.String(x) word_token_annotator <- Maxent_Word_Token_Annotator() a2 <- Annotation(1L, "sentence", 1L, nchar(s)) a2 <- annotate(s, word_token_annotator, a2) ...

1 a resposta

NLTK pos_tag do Python não retorna a tag correta da parte do discurso

Tendo isto: text = word_tokenize("The quick brown fox jumps over the lazy dog")E correndo: nltk.pos_tag(text)Eu recebo: [('The', 'DT'), ('quick', 'NN'), ('brown', 'NN'), ('fox', 'NN'), ('jumps', 'NNS'), ('over', 'IN'), ('the', 'DT'), ('lazy', ...

2 a resposta

Treinar modelo usando entidade nomeada

Estou usando o Corenlp Standford usando o REEDERNITY Entity.Nome tenho diferentes tipos de texto de entrada e preciso marcá-lo em minha própria entidade.Então, comecei a treinar meu próprio modelo e ele parece não estar funcionando. Por exemplo: ...

3 a resposta

A marcação de uma única palavra com o nltk pos tagger identifica cada letra em vez da palavra

Estou tentando marcar uma única palavra com o nltk pos tagger: word = "going" pos = nltk.pos_tag(word) print posMas a saída é esta: [('g', 'NN'), ('o', 'VBD'), ('i', 'PRP'), ('n', 'VBP'), ('g', 'JJ')]Está etiquetando cada letra em vez de apenas ...