Regressão logística de várias classes no SciKit Learn

Estou tendo problemas com a chamada adequada de regressão logística da Scikit para o caso de várias classes. Estou usando o solucionador de lbgfs e tenho o parâmetro multi_class definido como multinomial.

Não está claro para mim como passar os rótulos de classe verdadeiros no ajuste do modelo. Eu assumi que era semelhante / igual ao classificador aleatório de floresta multi-classe, onde você passa o quadro de dados [n_samples, m_classes]. No entanto, ao fazer isso, recebo um erro que os dados estão com uma forma ruim. ValueError: formato de entrada incorreto (20, 5) - neste pequeno exemplo, havia 5 classes e 20 amostras.

Na inspeção, a documentação para o método de ajuste diz que os valores de verdade são passados como [n_samples,] - que correspondem ao erro que estou recebendo - no entanto, não tenho idéia de como treinar o modelo com várias classes. Portanto, esta é a minha pergunta: como passo o conjunto completo de rótulos de classe para a função de ajuste?

Eu não consegui encontrar código de amostra na Internet para modelar, nem esta pergunta no StackOverflow .. mas tenho certeza de que alguém deve saber como fazer isso!

no código abaixo, train_features = [n_samples, nn_features], truth_train = [n_samples, m_classes]

clf = LogisticRegressionCV(class_weight='balanced', multi_class='multinomial', solver='lbfgs')
clf.fit(train_features, truth_train)
pred = clf.predict(test_features)

questionAnswers(1)

yourAnswerToTheQuestion