Матрица расстояний Python Pandas с использованием подобия jaccard

Я реализовал функцию для построения матрицы расстояний, используя подобие jaccard:

import pandas as pd
entries = [
    {'id':'1', 'category1':'100', 'category2': '0', 'category3':'100'},
    {'id':'2', 'category1':'100', 'category2': '0', 'category3':'100'},
    {'id':'3', 'category1':'0', 'category2': '100', 'category3':'100'},
    {'id':'4', 'category1':'100', 'category2': '100', 'category3':'100'},
    {'id':'5', 'category1':'100', 'category2': '0', 'category3':'100'}
           ]
df = pd.DataFrame(entries)

и матрица расстояний со Scipy

from scipy.spatial.distance import squareform
from scipy.spatial.distance import pdist, jaccard

res = pdist(df[['category1','category2','category3']], 'jaccard')
squareform(res)
distance = pd.DataFrame(squareform(res), index=df.index, columns= df.index)

Проблема в том, что мой результат выглядит так, который кажется ложным:

Что мне не хватает? Например, сходство 0 и 1 должно быть максимальным, а другие значения тоже кажутся неправильными

Ответы на вопрос(1)

Ваш ответ на вопрос