Qual é a maneira mais fácil de implementar a mineração de associação de termos no Solr?

Association mining parece dar bons resultados para recuperartermos relacionado em corpora de texto. Existem vários trabalhos sobre esse tópico, incluindo os conhecidos LSA método. A maneira mais direta de associar minas é criar uma matriz de co-ocorrência dedocs X terms e encontre termos que ocorrem nos mesmos documentos com mais frequência. Nos meus projetos anteriores, eu o implementei diretamente no Lucene por iteração sobre TermDocs (consegui-o chamando IndexReader.termDocs (Termo)). Mas não vejo nada parecido no Solr.

Então, meu needs estamos

Para recuperar o termos mais associados dentro de um campo específico.Para recuperar oterm, que é o mais próximo do especificado dentro de um campo específico.

Eu vourate answers Da seguinte maneira

Ideally, eu gostaria de encontrar o componente do Solr que cubra diretamente as necessidades especificadas, ou seja, algo para obter diretamente os termos associadoSe isso não for possível, estou procurando uma maneira de obter informações da matriz de co-ocorrência para o campo especificado.Se isso também não for uma opção, eu gostaria de saber a maneira mais direta de 1) obter todos os termos e 2) obter ids (números) de documentos em que esses termos ocorrem.

questionAnswers(3)

yourAnswerToTheQuestion