Resultados da pesquisa a pedido "nlp"
álculo rápido n-grama
Estou usando o NLTK para procurar n-gramas em um corpus, mas em alguns casos está demorando muito tempo. Notei que calcular n-gramas não é um recurso incomum em outros pacotes (aparentemente o Haystack tem alguma funcionalidade para isso). Isso ...
Como substituo a string exatamente usando gsub ()
Eu tenho um corpus: txt = "uma camada padronizada dentro de um padrão microeletrônico". Gostaria de substituir o termo "padrão" exatamente por "formulário", tento escrever um código: txt_replaced = gsub("pattern","form",txt)o entanto, o corpus ...
stratégia para analisar descrições de linguagem natural em dados estruturad
Tenho um conjunto de requisitos e estou procurando o melhor Baseado em Java estratégia / algorthm / software a ser usado. Basicamente, quero pegar um conjunto de ingredientes da receita digitados por pessoas reais em inglês natural e analisar ...
Como posso determinar melhor a capitalização correta de uma palavra?
Eu tenho um banco de dados contendo frases que contêm apenas letras maiúsculas. O banco de dados é técnico, contendo termos médicos, e eu quero normalizá-lo para que a capitalização seja (próxima) do que o usuário espera. Qual a melhor maneira ...
Como faço para criar palavra ou lematização?
Tentei o PorterStemmer e o Snowball, mas ambos não funcionam em todas as palavras, faltando algumas muito comun As minhas palavras de teste são: "cats running correu cactos cactos cactos comunidades comunitárias "e ambos ficam menos da metade ...
extrair relacionamentos usando NLTK
Isto é um acompanhamento da minha pergunta [https://stackoverflow.com/questions/7757554/extract-business-titles-and-time-periods-from-string] . Estou usando o nltk para analisar pessoas, organizações e seus relacionamentos. Usandoeste ...
aneira mais eficiente de indexar palavras em um document
Isto surgiu em outra pergunta, mas achei melhor fazer isso como uma pergunta separada. Dê uma grande lista de frases (ordem de 100 mil): [ "This is sentence 1 as an example", "This is sentence 1 as another example", "This is sentence 2", "This ...
Como faço para formar um vetor de recurso para um classificador direcionado ao Reconhecimento de Entidades Nomeada
Tenho um conjunto de tags (diferente do Nome, Local, Objeto etc.) convencional. No meu caso, eles são específicos do domínio e eu os chamo: Entidade, Ação, Incidente. Eu quero usá-los como uma semente para extrair mais entidades nomeadas. Me ...
Como abordar esta tarefa de classificação de entidade nomeada?
Estou fazendo uma pergunta relacionadaaqu [https://stackoverflow.com/questions/8219772/how-do-i-form-a-feature-vector-for-a-classifier-targeted-at-named-entity-recogni] mas esta questão é mais geral. Peguei um corpora grande e anotei ...
anco de Dados de Conjugações Verb [fechado]
Alguém sabe de um bom banco de dados para conjugações verbais? Estou criando um aplicativo de processamento de idioma natural. Embora eu tenha conseguido fazer bom uso do WordNet, ele não me permite verificar a forma de um verbo em um banco de ...