Resultados da pesquisa a pedido "information-retrieval"
Como analisar os dados dos Alertas do Google?
Em primeiro lugar, como você colocaria as informações dos Alertas do Google em um banco de dados que não fosse analisar o texto da mensagem de e-mail que o Google envi Parece que não há API de alertas do Google. Se você precisar analisar o ...
Transformando texto em vetor
Eu tenho um dicionário com palavras e a frequência de cada palavra. {'cxampphtdocsemployeesphp': 1, 'emptiness': 1, 'encodingundefinedconversionerror': 1, 'msbuildexe': 2, 'e5': 1, 'lnk4049': 1, 'specifierqualifierlist': 2, .... }Agora, quero ...
Obtendo a frequência total do termo em todo o índice (Elasticsearch)
Estou tentando calcular o número total de vezes que um termo específico ocorre em todo o índice (frequência de coleta de termos). Eu tentei fazê-lo através do uso de vetores de termos, no entanto, isso é restrito a um único documento. Mesmo no ...
Sistema de recuperação de imagem por cor da web usando C ++ com openframeworks
Eu estou escrevendo um programa em C ++ e openFrameworks que deve implementar um sistema de recuperação de imagem por correspondência de cores. Eu tenho um a...
Python: tf-idf-cosine: para encontrar a similaridade do documento
Eu estava seguindo um tutorial que estava disponível emParte 1 & Parte 2. Infelizmente, o autor não teve tempo para a seção final que envolveu o uso de s...
Por que o Lucene não suporta nenhum tipo de atualização em um documento existente
Meu caso de uso envolve indexar um documento Lucene e, em várias ocasiões futuras, adicionar termos que apontam para esse documento existente, sem excluir e ...
Python ou Java para processamento de texto (mineração de texto, recuperação de informações, processamento de linguagem natural) [fechado]
Em breve, começarei um novo projeto em que executarei muitas tarefas de processamento de texto, como pesquisa, categorização / classificação, clustering e assim por diant Haverá uma enorme quantidade de documentos que precisam ser ...
Existe uma maneira melhor de encontrar a interseção definida para o código do mecanismo de pesquis
Fui codificando um pequeno mecanismo de pesquisa e preciso descobrir se existe uma maneira mais rápida de encontrar interseções definidas. Atualmente, estou usando uma lista vinculada classificada, conforme explicado na maioria dos algoritmos dos ...
Como calcular o TF * IDF para um único novo documento a ser classificado?
Estou usando vetores de termo de documento para representar uma coleção de documentos. eu usoTF * IDF [http://en.wikipedia.org/wiki/Tf%E2%80%93idf]para calcular o termo ponderação para cada vetor de documento. Então eu poderia usar essa matriz ...