Resultados da pesquisa a pedido "nlp"

3 a resposta

álculo rápido n-grama

Estou usando o NLTK para procurar n-gramas em um corpus, mas em alguns casos está demorando muito tempo. Notei que calcular n-gramas não é um recurso incomum em outros pacotes (aparentemente o Haystack tem alguma funcionalidade para isso). Isso ...

1 a resposta

Como substituo a string exatamente usando gsub ()

Eu tenho um corpus: txt = "uma camada padronizada dentro de um padrão microeletrônico". Gostaria de substituir o termo "padrão" exatamente por "formulário", tento escrever um código: txt_replaced = gsub("pattern","form",txt)o entanto, o corpus ...

5 a resposta

stratégia para analisar descrições de linguagem natural em dados estruturad

Tenho um conjunto de requisitos e estou procurando o melhor Baseado em Java estratégia / algorthm / software a ser usado. Basicamente, quero pegar um conjunto de ingredientes da receita digitados por pessoas reais em inglês natural e analisar ...

3 a resposta

Como posso determinar melhor a capitalização correta de uma palavra?

Eu tenho um banco de dados contendo frases que contêm apenas letras maiúsculas. O banco de dados é técnico, contendo termos médicos, e eu quero normalizá-lo para que a capitalização seja (próxima) do que o usuário espera. Qual a melhor maneira ...

21 a resposta

Como faço para criar palavra ou lematização?

Tentei o PorterStemmer e o Snowball, mas ambos não funcionam em todas as palavras, faltando algumas muito comun As minhas palavras de teste são: "cats running correu cactos cactos cactos comunidades comunitárias "e ambos ficam menos da metade ...

3 a resposta

extrair relacionamentos usando NLTK

Isto é um acompanhamento da minha pergunta [https://stackoverflow.com/questions/7757554/extract-business-titles-and-time-periods-from-string] . Estou usando o nltk para analisar pessoas, organizações e seus relacionamentos. Usandoeste ...

2 a resposta

aneira mais eficiente de indexar palavras em um document

Isto surgiu em outra pergunta, mas achei melhor fazer isso como uma pergunta separada. Dê uma grande lista de frases (ordem de 100 mil): [ "This is sentence 1 as an example", "This is sentence 1 as another example", "This is sentence 2", "This ...

1 a resposta

Como faço para formar um vetor de recurso para um classificador direcionado ao Reconhecimento de Entidades Nomeada

Tenho um conjunto de tags (diferente do Nome, Local, Objeto etc.) convencional. No meu caso, eles são específicos do domínio e eu os chamo: Entidade, Ação, Incidente. Eu quero usá-los como uma semente para extrair mais entidades nomeadas. Me ...

3 a resposta

Como abordar esta tarefa de classificação de entidade nomeada?

Estou fazendo uma pergunta relacionadaaqu [https://stackoverflow.com/questions/8219772/how-do-i-form-a-feature-vector-for-a-classifier-targeted-at-named-entity-recogni] mas esta questão é mais geral. Peguei um corpora grande e anotei ...

3 a resposta

anco de Dados de Conjugações Verb [fechado]

Alguém sabe de um bom banco de dados para conjugações verbais? Estou criando um aplicativo de processamento de idioma natural. Embora eu tenha conseguido fazer bom uso do WordNet, ele não me permite verificar a forma de um verbo em um banco de ...