Scikit-Learn Lineare Regression Wie erhält man die jeweiligen Merkmale des Koeffizienten?

Question

Nov 16, 2014, 12:14 AM

feature-selection scikit-learn linear-regression

Scikit-Learn Lineare Regression Wie erhält man die jeweiligen Merkmale des Koeffizienten?

Ich versuche, die Merkmalsauswahl durchzuführen, indem ich die Ausgaben meiner Regressionskoeffizienten auswerte und die Merkmale mit den höchsten Größenkoeffizienten auswähle. Das Problem ist, dass ich nicht weiß, wie ich die entsprechenden Features erhalten soll, da nur Koeffizienten aus dem Attribut coef._ zurückgegeben werden. In der Dokumentation steht:

Geschätzte Koeffizienten für das lineare Regressionsproblem. Wenn während der Anpassung mehrere Ziele übergeben werden (y 2D), handelt es sich um ein 2D-Array mit Formen (n_Ziele, n_Funktionen). Wenn nur ein Ziel übergeben wird, handelt es sich um ein 1D-Array mit der Länge n_Funktionen.

Ich gehe in mein regression.fit (A, B) über, wobei A ein 2D-Array mit dem tfidf-Wert für jedes Feature in einem Dokument ist. Beispielformat:

         "feature1"   "feature2"
"Doc1"    .44          .22
"Doc2"    .11          .6
"Doc3"    .22          .2

B sind meine Zielwerte für die Daten, die nur die Nummern 1-100 sind, die jedem Dokument zugeordnet sind:

"Doc1"    50
"Doc2"    11
"Doc3"    99

nter Verwendung von regression.coef_ erhalte ich eine Liste von Koeffizienten, aber nicht die entsprechenden Funktionen! Wie kann ich die Funktionen bekommen? Ich schätze, ich muss die Struktur meiner B-Ziele modifizieren, aber ich weiß nicht wie.