Resultados da pesquisa a pedido "information-retrieval"

3 a resposta

Como analisar os dados dos Alertas do Google?

Em primeiro lugar, como você colocaria as informações dos Alertas do Google em um banco de dados que não fosse analisar o texto da mensagem de e-mail que o Google envi Parece que não há API de alertas do Google. Se você precisar analisar o ...

2 a resposta

Transformando texto em vetor

Eu tenho um dicionário com palavras e a frequência de cada palavra. {'cxampphtdocsemployeesphp': 1, 'emptiness': 1, 'encodingundefinedconversionerror': 1, 'msbuildexe': 2, 'e5': 1, 'lnk4049': 1, 'specifierqualifierlist': 2, .... }Agora, quero ...

2 a resposta

Obtendo a frequência total do termo em todo o índice (Elasticsearch)

Estou tentando calcular o número total de vezes que um termo específico ocorre em todo o índice (frequência de coleta de termos). Eu tentei fazê-lo através do uso de vetores de termos, no entanto, isso é restrito a um único documento. Mesmo no ...

1 a resposta

Sistema de recuperação de imagem por cor da web usando C ++ com openframeworks

Eu estou escrevendo um programa em C ++ e openFrameworks que deve implementar um sistema de recuperação de imagem por correspondência de cores. Eu tenho um a...

6 a resposta

Python: tf-idf-cosine: para encontrar a similaridade do documento

Eu estava seguindo um tutorial que estava disponível emParte 1 & Parte 2. Infelizmente, o autor não teve tempo para a seção final que envolveu o uso de s...

1 a resposta

Por que o Lucene não suporta nenhum tipo de atualização em um documento existente

Meu caso de uso envolve indexar um documento Lucene e, em várias ocasiões futuras, adicionar termos que apontam para esse documento existente, sem excluir e ...

4 a resposta

Python ou Java para processamento de texto (mineração de texto, recuperação de informações, processamento de linguagem natural) [fechado]

Em breve, começarei um novo projeto em que executarei muitas tarefas de processamento de texto, como pesquisa, categorização / classificação, clustering e assim por diant Haverá uma enorme quantidade de documentos que precisam ser ...

4 a resposta

Existe uma maneira melhor de encontrar a interseção definida para o código do mecanismo de pesquis

Fui codificando um pequeno mecanismo de pesquisa e preciso descobrir se existe uma maneira mais rápida de encontrar interseções definidas. Atualmente, estou usando uma lista vinculada classificada, conforme explicado na maioria dos algoritmos dos ...

3 a resposta

Como calcular o TF * IDF para um único novo documento a ser classificado?

Estou usando vetores de termo de documento para representar uma coleção de documentos. eu usoTF * IDF [http://en.wikipedia.org/wiki/Tf%E2%80%93idf]para calcular o termo ponderação para cada vetor de documento. Então eu poderia usar essa matriz ...

3 a resposta

Implementações do TF-IDF em python