Я думал, что принял это. Но я обнаружил, что просто нажал кнопку upvote. Прости за это.
меня есть
матрица сходства пользователя и пользователя, что некоторые строки имеют повторяющиеся значения иNaN
userId 316 320 359 370 910
userId
316 1.0 0.500000 0.500000 0.500000 NaN
320 0.5 1.000000 0.242837 0.019035 0.031737
359 0.5 0.242837 1.000000 0.357620 0.175914
370 0.5 0.019035 0.357620 1.000000 0.317371
910 NaN 0.031737 0.175914 0.317371 1.000000
Что я хочуЯ хочу, чтобы рейтинг сравнимости для каждого ряда был отчетливым. Вот так:
userId 316 320 359 370 910
userId
316 1 2 3 4 NaN
320 2 1 3 5 1
359 2 4 1 3 5
370 2 5 3 1 4
910 NaN 4 3 2 1
Ранг между одинаковыми значениями не важен. Но это должна быть отдельная ценность. А такжеNaN
должен быть сохранен.
Я пыталсяdf.rank(ascending =False,axis = 1)
(доктор), который не смог дать мне отчетливое значение ранга.
Я тоже пробовалscipy.stats.rankdata
(доктор), но это не может держатьNaN
.