sobre semelhança cosseno
Estou encontrando semelhança de cosseno entre documentos. Eu fiz assim
D1 = (8,0,0,1) onde 8,0,0,1 são as pontuações tf-idf dos termos t1, t2, t3, t4
D2 = (7,0,0,1)
cos (teta) = (56 + 0 + 0 + 1) / sqrt (64 + 49) sqrt (1 +1)
que acaba por ser
cos (teta) = 5
Agora, o que eu avalio a partir desse valor ... Não entendo o que cos (theta) = 5 significa sobre a semelhança entre eles ... Estou fazendo as coisas corretamente?