Resultados da pesquisa a pedido "nlp"

5 a resposta

Como executar a lematização em R?

Esta pergunta é uma possível duplicata deLematizador em R ou python (am, are, is -> be?) [https://stackoverflow.com/questions/22993796/lemmatizer-in-r-or-python-am-are-is-be] , mas estou adicionando novamente, pois o anterior foi fechado, dizendo ...

1 a resposta

Como combinar números inteiros no NLTK CFG?

Se eu quiser definir uma gramática na qual um dos tokens corresponderá a um número inteiro, como consegui-lo usando a string CFG do nltk? Por exemplo - S -> SK SO FK SK -> 'SELECT' SO -> '\d+' FK -> 'FROM'

2 a resposta

Como gerar pedaços NLTK para arquivo?

Eu tenho esse script python onde estou usando a biblioteca nltk para analisar, tokenizar, marcar e chunk, alguns digamos texto aleatório da web. Eu preciso formatar e gravar em um arquivo a saída dechunked1,chunked2,chunked3. Estes têm tipoclass ...

1 a resposta

Como lidar com gírias e formas curtas em Tweets como luv, kool e brb?

Estou fazendo o pré-processamento de tweets usando Python. No entanto, muitas palavras usadas são formas curtas de outras palavras como luv, kool etc. E também abreviações como brb, ttyl etc. No momento, só consigo pensar em ter um Hashmap ...

2 a resposta

definir arquivo de modelo CRF ++

este [https://stackoverflow.com/questions/16886251/faliure-in-reading-training-data-tagger-cpp-393-crf] é o meu problema, mas não diz como definir o arquivo de modelo corretamente. Meu arquivo de treinamento fica assim: 上 B-NR 海 L-NR 浦 B-NR 东 ...

2 a resposta

Como descobrir se existe uma palavra em inglês usando o nltk

Estou procurando uma solução adequada para esta pergunta. Esta pergunta já foi feita muitas vezes antes e eu não encontrei uma única resposta adequada. Preciso usar um corpus no NLTK para detectar se uma palavra é uma palavra em inglês Eu tentei ...

2 a resposta

Transformando texto em vetor

Eu tenho um dicionário com palavras e a frequência de cada palavra. {'cxampphtdocsemployeesphp': 1, 'emptiness': 1, 'encodingundefinedconversionerror': 1, 'msbuildexe': 2, 'e5': 1, 'lnk4049': 1, 'specifierqualifierlist': 2, .... }Agora, quero ...

4 a resposta

PyParsing: este uso correto de setParseAction ()?

Eu tenho seqüências de caracteres como esta: "MSE 2110, 3030, 4102"Gostaria de mostrar: [("MSE", 2110), ("MSE", 3030), ("MSE", 4102)]Esta é a minha maneira de fazer isso, embora eu ainda não tenha entendido: def makeCourseList(str, location, ...

4 a resposta

comparando sinônimos NLTK [duplicado]

Esta pergunta já tem uma resposta aqui: Todos os sinônimos da palavra em python? [duplicado] [/questions/19348973/all-synonyms-for-word-in-python] 3 respostasNão consigo encontrar um problema mais estranho, acho que você vai me ajudar. for p in ...

3 a resposta

A marcação de uma única palavra com o nltk pos tagger identifica cada letra em vez da palavra

Estou tentando marcar uma única palavra com o nltk pos tagger: word = "going" pos = nltk.pos_tag(word) print posMas a saída é esta: [('g', 'NN'), ('o', 'VBD'), ('i', 'PRP'), ('n', 'VBP'), ('g', 'JJ')]Está etiquetando cada letra em vez de apenas ...