¿Cómo funciona la matriz de distancia condensada? (pdist)
scipy.spatial.distance.pdist
Devuelve una matriz de distancia condensada. Desdela documentación:
Devuelve una matriz de distancia condensada Y. Para cada y (donde), la métrica dist (u = X [i], v = X [j]) se calcula y almacena en la entrada ij.
penséij
significabai*j
. Pero creo que podría estar equivocado. Considerar
X = array([[1,2], [1,2], [3,4]])
dist_matrix = pdist(X)
entonces la documentación dice quedist(X[0], X[2])
debiera serdist_matrix[0*2]
. Sin embargo,dist_matrix[0*2]
es 0 - no 2.8 como debería ser.
¿Cuál es la fórmula que debo usar para acceder a la similitud de dos vectores, dadoi
yj
?