По какой-то причине мне кажется, что данные являются побочными, и вы должны транспонировать их и вырезать первый ряд

рий

Я прочитал CSV (который \ t разделен) в Dataframe, который теперь должен быть в формате массива массивов для кластеризации без изменения типа

Проблема

Что касается проверенных ссылок (ниже), я не смог получить вывод при необходимости. Два значения столбца, которые я пытаюсь получить, находятся в int64 / float64, как показано ниже

         uid   iid       rat
0        196   242  3.000000
1        186   302  3.000000
2         22   377  1.000000

Меня интересует толькон.о.р. а такжекрыса на данный момент, и передать его в метод Kmeans.fit (), и это тоже не с EPSILON в нем. Мне нужно в следующем формате

Ожидаемый формат

[[242, 3.000000],
[302, 3.000000],
[22, 1.000000]]

Неудачная попытка

X = values[:, 1:2]
Y = values[:, 2:3]
someArray = np.array([X,Y])
print someArray

и не прощается с казнью

[[[  2.42000000e+02]
  [  3.02000000e+02]
  [  3.77000000e+02]
  ..., 
  [  1.35200000e+03]
  [  1.62600000e+03]
  [  1.65900000e+03]]
 [[  3.00000000e+00]
  [  3.00000000e+00]
  [  1.00000000e+00]
  ..., 
  [  1.00000000e+00]
  [  1.00000000e+00]
  [  1.00000000e+00]]]

До сих пор беспомощные ссылки

Вот этотЭто дваЭто триЭто четыреРЕДАКТИРОВАТЬ 1

пыталсяnp_df = np.genfromtxt('AllData.csv', delimiter='\t', unpack=True) и получил это

[[             nan   1.96000000e+02   1.86000000e+02 ...,   4.79000000e+02
    4.79000000e+02   4.79000000e+02]
 [             nan   2.42000000e+02   3.02000000e+02 ...,   1.36000000e+03
    1.39400000e+03   1.65200000e+03]
 [             nan   3.00000000e+00   3.00000000e+00 ...,   2.00000000e+00
    1.92803605e+00   1.00000000e+00]]

Ответы на вопрос(0)

Ваш ответ на вопрос