Qual é a diferença entre filtragem colaborativa baseada em itens e baseada em conteúdo?
Estou confuso sobre o que é a recomendação baseada em itens, conforme descrito no livro "Mahout em ação". Existe o algoritmo no livro:
for every item i that u has no preference for yet
for every item j that u has a preference for
compute a similarity s between i and j
add u's preference for j, weighted by s, to a running average
return the top items, ranked by weighted average
Como posso calcular a similaridade entre itens? Se estiver usando o conteúdo, não é uma recomendação baseada em conteúdo?