Resultados da pesquisa a pedido "nlp"
Análise de sentimentos não supervisionados
Eu tenho lido muitos artigos que explicam a necessidade de um conjunto inicial de textos classificados como 'positivos' ou 'negativos' antes que um sistema de análise de sentimentos realmente funcione. Minha pergunta é: Alguém já tentou fazer ...
Converter caracteres chineses em hanyu pinyin
Como converterdecaracteres chinesesparahanyu pinyin? Por exemplo. 你 -> Nǐ 马 -> Mǎ Mais informações: Acentos ou formas numéricas de hanyu pinyin são aceitáveis, sendo a forma numérica a minha preferência. Uma biblioteca Java é preferida, no ...
Existe um algoritmo para ajudar a detectar o "tópico principal" de uma frase em inglê
Estou tentando descobrir se existe um algoritmo conhecido que possa detectar o "conceito-chave" de uma fras O caso de uso é o seguinte: usuário digita uma frase como uma consulta (o frango tem gosto de peru Nosso sistema identifica os ...
Maltparser dando erro no NLTK
Meu código é from nltk.parse import malt mp = malt.MaltParser(working_dir="/other/apps/maltparser-1.8.1",mco="engmalt.poly-1.7.mco",additional_java_args=['-Xmx1024m']) print mp.raw_parse("Hello World")E o erro é Traceback (most recent call ...
Alguém conhece algum bom software de Desambiguação do Word Sense? [fechadas]
O que representa o estado da arte no software Word Sense Desambiguation (WSD)? Quais métricas determinam o estado da arte e quais kits de ferramentas / pacotes de código aberto estão disponíveis?
Extração de nome - CV / Currículo - Stanford NER / OpenNLP
Atualmente, estou em um projeto de aprendizagem para extrair o nome de um indivíduo de seu currículo / currículo. Atualmente, estou trabalhando com o Stanford-NER e o OpenNLP, ambos com um certo sucesso desde o início, tendendo a lutar com nomes ...
Núcleo de StanfordNLP - palavras divididas ignorando o apóstrofo
Estou tentando dividir uma frase em palavras usando o Stanford coreNLP. Estou tendo problemas com palavras que contenham apóstrofo.Por exemplo, a frase: tenh...
Java Stanford PNL: Parte dos rótulos de fala?
A PNL de Stanford, demo'dAqui, dá uma saída como esta:
Stemming - exemplos de código ou projetos de código abert
Stemming é algo que é necessário em sistemas de marcação. Uso delicioso e não tenho tempo para gerenciar e remover minhas tags. Sou um pouco mais cuidadoso com o meu blog, mas não é perfeito. Escrevo software para sistemas embarcados que seriam ...
Como remover a pontuação?
Estou usando o tokenizer deNLTK em Python. Já existem várias respostas para remover pontuações no fórum. No entanto, nenhum deles aborda todos os seguintes problemas juntos: Mais de um símbolo em uma linha. Por exemplo, a frase: Ele disse: "é ...