Regressão linear Scikit-Learn como obter os respectivos recursos do coeficiente?
Estou tentando executar a seleção de recursos avaliando minhas saídas do coeficiente de regressão e selecione os recursos com os maiores coeficientes de magnitude. O problema é que não sei como obter os respectivos recursos, pois apenas os coeficientes são retornados do atributo coef._. A documentação diz:
Coeficientes estimados para o problema de regressão linear. Se vários destinos são passados durante o ajuste (y 2D), esta é uma matriz 2D de forma (n_targets, n_features), enquanto que apenas um destino é passado, essa é uma matriz 1D de comprimento n_features.
Estou passando para o meu regression.fit (A, B), onde A é uma matriz 2-D, com valor tfidf para cada recurso em um documento. Exemplo de formato:
"feature1" "feature2"
"Doc1" .44 .22
"Doc2" .11 .6
"Doc3" .22 .2
B são meus valores-alvo para os dados, que são apenas os números 1 a 100 associados a cada documento:
"Doc1" 50
"Doc2" 11
"Doc3" 99
Usando regression.coef_, recebo uma lista de coeficientes, mas não os recursos correspondentes! Como posso obter os recursos? Acho que preciso modificar a estrutura dos meus alvos B, mas não sei como.