По какой-то причине мне кажется, что данные являются побочными, и вы должны транспонировать их и вырезать первый ряд
Я прочитал CSV (который \ t разделен) в Dataframe, который теперь должен быть в формате массива массивов для кластеризации без изменения типа
ПроблемаЧто касается проверенных ссылок (ниже), я не смог получить вывод при необходимости. Два значения столбца, которые я пытаюсь получить, находятся в int64 / float64, как показано ниже
uid iid rat
0 196 242 3.000000
1 186 302 3.000000
2 22 377 1.000000
Меня интересует толькон.о.р. а такжекрыса на данный момент, и передать его в метод Kmeans.fit (), и это тоже не с EPSILON в нем. Мне нужно в следующем формате
Ожидаемый формат
[[242, 3.000000],
[302, 3.000000],
[22, 1.000000]]
Неудачная попытка
X = values[:, 1:2]
Y = values[:, 2:3]
someArray = np.array([X,Y])
print someArray
и не прощается с казнью
[[[ 2.42000000e+02]
[ 3.02000000e+02]
[ 3.77000000e+02]
...,
[ 1.35200000e+03]
[ 1.62600000e+03]
[ 1.65900000e+03]]
[[ 3.00000000e+00]
[ 3.00000000e+00]
[ 1.00000000e+00]
...,
[ 1.00000000e+00]
[ 1.00000000e+00]
[ 1.00000000e+00]]]
До сих пор беспомощные ссылки
Вот этотЭто дваЭто триЭто четыреРЕДАКТИРОВАТЬ 1пыталсяnp_df = np.genfromtxt('AllData.csv', delimiter='\t', unpack=True)
и получил это
[[ nan 1.96000000e+02 1.86000000e+02 ..., 4.79000000e+02
4.79000000e+02 4.79000000e+02]
[ nan 2.42000000e+02 3.02000000e+02 ..., 1.36000000e+03
1.39400000e+03 1.65200000e+03]
[ nan 3.00000000e+00 3.00000000e+00 ..., 2.00000000e+00
1.92803605e+00 1.00000000e+00]]