как мы можем узнать имена выбранных и пропущенных объектов (столбцов) (заголовок) с помощью scikit-learn
Я объясняю сценарий с частью данных:
Ex. набор данных.
GA_ID PN_ID PC_ID MBP_ID GR_ID AP_ID class
0.033 6.652 6.681 0.194 0.874 3.177 0
0.034 9.039 6.224 0.194 1.137 0 0
0.035 10.936 10.304 1.015 0.911 4.9 1
0.022 10.11 9.603 1.374 0.848 4.566 1
0.035 2.963 17.156 0.599 0.823 9.406 1
0.033 10.872 10.244 1.015 0.574 4.871 1
0.035 21.694 22.389 1.015 0.859 9.259 1
0.035 10.936 10.304 1.015 0.911 4.9 1
0.035 10.936 10.304 1.015 0.911 4.9 1
0.035 10.936 10.304 1.015 0.911 4.9 0
0.036 1.373 12.034 0.35 0.259 5.723 0
0.033 9.831 9.338 0.35 0.919 4.44 0
шаг выбора функции 1 и его результат: VarianceThreshol
PN_ID PC_ID MBP_ID GR_ID AP_ID class
6.652 6.681 0.194 0.874 3.177 0
9.039 6.224 0.194 1.137 0 0
10.936 10.304 1.015 0.911 4.9 1
10.11 9.603 1.374 0.848 4.566 1
2.963 17.156 0.599 0.823 9.406 1
10.872 10.244 1.015 0.574 4.871 1
21.694 22.389 1.015 0.859 9.259 1
10.936 10.304 1.015 0.911 4.9 1
10.936 10.304 1.015 0.911 4.9 1
10.936 10.304 1.015 0.911 4.9 0
1.373 12.034 0.35 0.259 5.723 0
9.831 9.338 0.35 0.919 4.44 0
шаг выбора объекта 2 и его результат: выбор объектов на основе дерева (например, из klearn.ensemble import ExtraTreesClassifier)
PN_ID MBP_ID GR_ID AP_ID class
6.652 0.194 0.874 3.177 0
9.039 0.194 1.137 0 0
10.936 1.015 0.911 4.9 1
10.11 1.374 0.848 4.566 1
2.963 0.599 0.823 9.406 1
10.872 1.015 0.574 4.871 1
21.694 1.015 0.859 9.259 1
10.936 1.015 0.911 4.9 1
10.936 1.015 0.911 4.9 1
10.936 1.015 0.911 4.9 0
1.373 0.35 0.259 5.723 0
9.831 0.35 0.919 4.44 0
Здесь мы можем заключить, что мы начали с 6 столбцов (объектов) и одной метки класса и на последнем этапе сократили ее до 4 объектов и одной метки класса. Столбцы GA_ID и PC_ID были удалены, а модель построена с использованием функций PN_ID, MBP_ID, GR_ID и AP_ID.
Но, к сожалению, когда я выполнил выбор функции с помощью доступных методов в библиотеке scikit-learn, я обнаружил, что она возвращает только форму данных и уменьшенные данные без имени выбранных и пропущенных объектов.
Я записал много глупых кодов Python (поскольку я не очень опытный программист), чтобы найти ответ, но не удалось.
пожалуйста, предложите мне какой-нибудь способ выбраться из этого благодаря
(Примечание: специально для этого поста я никогда не использовал какой-либо метод выбора объектов для данного примера набора данных, скорее, я случайно удалил столбец, чтобы объяснить случай)