Вы спасатель жизни!
аюсь запустить следующий код. Кстати, я новичок как в Python, так и в Sklearn.
import pandas as pd
import numpy as np
from sklearn.linear_model import LogisticRegression
# data import and preparation
trainData = pd.read_csv('train.csv')
train = trainData.values
testData = pd.read_csv('test.csv')
test = testData.values
X = np.c_[train[:, 0], train[:, 2], train[:, 6:7], train[:, 9]]
X = np.nan_to_num(X)
y = train[:, 1]
Xtest = np.c_[test[:, 0:1], test[:, 5:6], test[:, 8]]
Xtest = np.nan_to_num(Xtest)
# model
lr = LogisticRegression()
lr.fit(X, y)
где у - np.ndarray из 0 и 1
Я получаю следующее:
Файл "C: \ Anaconda3 \ lib \ site-packages \ sklearn \ linear_model \ logistic.py", строка> 1174, в соответствии с check_classification_targets (y)
Файл "C: \ Anaconda3 \ lib \ site-packages \ sklearn \ utils \ multiclass.py", строка 172,> в check_classification_targets поднимает ValueError ("Неизвестный тип метки:% r"% y_type)
ValueError: Неизвестный тип метки: «unknown»
из склеарн документации:http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression.fit
y: массив, форма (n_samples,) целевые значения (метки классов в классификации, действительные числа в регрессии)
В чем моя ошибка?
UPD:
y - массив ([0.0, 1.0, 1.0, ..., 0.0, 1.0, 0.0], dtype = object) размер - (891,)