Resultados da pesquisa a pedido "information-retrieval"

4 a resposta

Python ou Java para processamento de texto (mineração de texto, recuperação de informações, processamento de linguagem natural) [fechado]

Em breve, começarei um novo projeto em que executarei muitas tarefas de processamento de texto, como pesquisa, categorização / classificação, clustering e assim por diant Haverá uma enorme quantidade de documentos que precisam ser ...

2 a resposta

Transformando texto em vetor

Eu tenho um dicionário com palavras e a frequência de cada palavra. {'cxampphtdocsemployeesphp': 1, 'emptiness': 1, 'encodingundefinedconversionerror': 1, 'msbuildexe': 2, 'e5': 1, 'lnk4049': 1, 'specifierqualifierlist': 2, .... }Agora, quero ...

2 a resposta

Como posso recuperar meu histórico de pesquisa do Google?

Na interface do Histórico da web do Google, posso ver todas as consultas de pesquisa que usei ao longo dos anos e as páginas que visitei para uma consulta específica. Existe uma maneira de recuperar esse histórico usando um programa ...

2 a resposta

cript Python para encontrar frequências de palavras de um determinado documen

Estou procurando um script simples que possa encontrar frequências de palavras para um determinado documento (provavelmente usando o stemmer portátil Existe alguma biblioteca ou script simples que faça esse process

6 a resposta

Download de texto da Wikipedia

Estou procurando baixar o texto completo da Wikipedia para o meu projeto da faculdade. Preciso escrever minha própria aranha para fazer o download ou existe um conjunto de dados público da Wikipedia disponível online? Para lhe dar uma visão ...

2 a resposta

Construindo um mecanismo de busca rápido semântico MySQL para artigos privados a partir do zero

2 a resposta

Obtendo a frequência total do termo em todo o índice (Elasticsearch)

Estou tentando calcular o número total de vezes que um termo específico ocorre em todo o índice (frequência de coleta de termos). Eu tentei fazê-lo através do uso de vetores de termos, no entanto, isso é restrito a um único documento. Mesmo no ...

1 a resposta

Sistema de recuperação de imagem por cor da web usando C ++ com openframeworks

Eu estou escrevendo um programa em C ++ e openFrameworks que deve implementar um sistema de recuperação de imagem por correspondência de cores. Eu tenho um a...

1 a resposta

Calculando tf-idf entre documentos usando python 2.7

Tenho um cenário em que recuperei informações / dados brutos da Internet e os coloquei em seus respectivos arquivos json ou .txt. A partir daí, eu gostaria de calcular as frequências de cada termo em cada documento e sua similaridade de cosseno ...

1 a resposta

Como raspar na Web notícias diárias uma vez por dia usando Python?

Estou tentando criar um aplicativo para o qual preciso de feeds de notícias diárias de vários sites. Uma maneira de fazer isso é usandoBeautifulSoup [http://www.crummy.com/software/BeautifulSoup/bs4/doc/]biblioteca de Python. No entanto, isso é ...