Resultados da pesquisa a pedido "information-retrieval"
Por que o Lucene não suporta nenhum tipo de atualização em um documento existente
Meu caso de uso envolve indexar um documento Lucene e, em várias ocasiões futuras, adicionar termos que apontam para esse documento existente, sem excluir e ...
Sistema de recuperação de imagem por cor da web usando C ++ com openframeworks
Eu estou escrevendo um programa em C ++ e openFrameworks que deve implementar um sistema de recuperação de imagem por correspondência de cores. Eu tenho um a...
Calculando tf-idf entre documentos usando python 2.7
Tenho um cenário em que recuperei informações / dados brutos da Internet e os coloquei em seus respectivos arquivos json ou .txt. A partir daí, eu gostaria de calcular as frequências de cada termo em cada documento e sua similaridade de cosseno ...
Como raspar na Web notícias diárias uma vez por dia usando Python?
Estou tentando criar um aplicativo para o qual preciso de feeds de notícias diárias de vários sites. Uma maneira de fazer isso é usandoBeautifulSoup [http://www.crummy.com/software/BeautifulSoup/bs4/doc/]biblioteca de Python. No entanto, isso é ...
Lematização de palavras não inglesas?
Eu gostaria de aplicar a lematização para reduzir as formas flexionadas de palavras. Sei que no idioma inglês o WordNet fornece essa funcionalidade, mas também estou interessado em aplicar a lematização para palavras holandesas, francesas, ...
Escrevendo um programa para criar fóruns
Preciso escrever um programa para criar fóruns. Devo escrever o programa em Python usando a estrutura Scrapy ou devo usar Php cURL? Também existe um php equivalente ao Scrapy? obrigado
Como posso recuperar meu histórico de pesquisa do Google?
Na interface do Histórico da web do Google, posso ver todas as consultas de pesquisa que usei ao longo dos anos e as páginas que visitei para uma consulta específica. Existe uma maneira de recuperar esse histórico usando um programa ...
Obtendo a frequência total do termo em todo o índice (Elasticsearch)
Estou tentando calcular o número total de vezes que um termo específico ocorre em todo o índice (frequência de coleta de termos). Eu tentei fazê-lo através do uso de vetores de termos, no entanto, isso é restrito a um único documento. Mesmo no ...