как мы можем узнать имена выбранных и пропущенных объектов (столбцов) (заголовок) с помощью scikit-learn

Question

Mar 24, 2015, 11:21 AM

python machine-learning scikit-image scikit-learn

как мы можем узнать имена выбранных и пропущенных объектов (столбцов) (заголовок) с помощью scikit-learn

Я объясняю сценарий с частью данных:

Ex. набор данных.

GA_ID   PN_ID   PC_ID   MBP_ID  GR_ID   AP_ID   class
0.033   6.652   6.681   0.194   0.874   3.177     0
0.034   9.039   6.224   0.194   1.137   0         0
0.035   10.936  10.304  1.015   0.911   4.9       1
0.022   10.11   9.603   1.374   0.848   4.566     1
0.035   2.963   17.156  0.599   0.823   9.406     1
0.033   10.872  10.244  1.015   0.574   4.871     1
0.035   21.694  22.389  1.015   0.859   9.259     1
0.035   10.936  10.304  1.015   0.911   4.9       1
0.035   10.936  10.304  1.015   0.911   4.9       1
0.035   10.936  10.304  1.015   0.911   4.9       0
0.036   1.373   12.034  0.35    0.259   5.723     0
0.033   9.831   9.338   0.35    0.919   4.44      0

шаг выбора функции 1 и его результат: VarianceThreshol

     PN_ID  PC_ID   MBP_ID  GR_ID   AP_ID   class
    6.652   6.681   0.194   0.874   3.177     0
    9.039   6.224   0.194   1.137   0         0
    10.936  10.304  1.015   0.911   4.9       1
    10.11   9.603   1.374   0.848   4.566     1
    2.963   17.156  0.599   0.823   9.406     1
    10.872  10.244  1.015   0.574   4.871     1
    21.694  22.389  1.015   0.859   9.259     1
    10.936  10.304  1.015   0.911   4.9       1
    10.936  10.304  1.015   0.911   4.9       1
    10.936  10.304  1.015   0.911   4.9       0
    1.373   12.034  0.35    0.259   5.723     0
    9.831   9.338   0.35    0.919   4.44      0

шаг выбора объекта 2 и его результат: выбор объектов на основе дерева (например, из klearn.ensemble import ExtraTreesClassifier)

PN_ID   MBP_ID  GR_ID   AP_ID   class
6.652   0.194   0.874   3.177     0
9.039   0.194   1.137   0         0
10.936  1.015   0.911   4.9       1
10.11   1.374   0.848   4.566     1
2.963   0.599   0.823   9.406     1
10.872  1.015   0.574   4.871     1
21.694  1.015   0.859   9.259     1
10.936  1.015   0.911   4.9       1
10.936  1.015   0.911   4.9       1
10.936  1.015   0.911   4.9       0
1.373   0.35    0.259   5.723     0
9.831   0.35    0.919   4.44      0

Здесь мы можем заключить, что мы начали с 6 столбцов (объектов) и одной метки класса и на последнем этапе сократили ее до 4 объектов и одной метки класса. Столбцы GA_ID и PC_ID были удалены, а модель построена с использованием функций PN_ID, MBP_ID, GR_ID и AP_ID.

Но, к сожалению, когда я выполнил выбор функции с помощью доступных методов в библиотеке scikit-learn, я обнаружил, что она возвращает только форму данных и уменьшенные данные без имени выбранных и пропущенных объектов.

Я записал много глупых кодов Python (поскольку я не очень опытный программист), чтобы найти ответ, но не удалось.

пожалуйста, предложите мне какой-нибудь способ выбраться из этого благодаря

(Примечание: специально для этого поста я никогда не использовал какой-либо метод выбора объектов для данного примера набора данных, скорее, я случайно удалил столбец, чтобы объяснить случай)

как мы можем узнать имена выбранных и пропущенных объектов (столбцов) (заголовок) с помощью scikit-learn

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

как мы можем узнать имена выбранных и пропущенных объектов (столбцов) (заголовок) с помощью scikit-learn

Ответы на вопрос(1)

Ваш ответ на вопрос

Популярные вопросы