Мультиклассовая логистическая регрессия в SciKit Learn
У меня проблемы с правильным вызовом Логистической регрессии Scikit для мультиклассового случая. Я использую решатель lbgfs, и у меня есть параметр multi_class установлен на многочлен.
Мне непонятно, как передать истинные метки классов при подгонке модели. Я предполагал, что это было так же, как и для мультикласса классификатора случайных лесов, где вы передаете [n_samples, m_classes] dataframe. Однако при этом я получаю ошибку, что данные имеют плохую форму. ValueError: неправильная форма ввода (20, 5) - в этом крошечном примере было 5 классов, 20 образцов.
При проверке в документации для метода fit говорится, что значения истинности передаются как [n_samples,] - что соответствует получаемой мной ошибке - однако я не знаю, как обучить модель нескольким классам. Итак, это мой вопрос: как передать полный набор меток классов в функцию подгонки?
Я не смог найти образец кода в Интернете для моделирования, ни этот вопрос о StackOverflow ... но я уверен, что кто-то должен знать, как это сделать!
в приведенном ниже коде train_features = [n_samples, nn_features], true_train = [n_samples, m_classes]
clf = LogisticRegressionCV(class_weight='balanced', multi_class='multinomial', solver='lbfgs')
clf.fit(train_features, truth_train)
pred = clf.predict(test_features)