Como posso usar o PCA / SVD no Python para seleção e identificação de recursos?
estou seguindoAnálise de componentes principais em Python usar o PCA em Python, mas estou lutando para determinarqual recursos para escolher (ou seja, quais das minhas colunas / recursos têm a melhor variação).
Quando eu usoscipy.linalg.svd
, ele automaticamente classifica meus valores singulares, então não posso dizer a qual coluna eles pertencem.
Exemplo de código:
import numpy as np
from scipy.linalg import svd
M = [
[1, 1, 1, 1, 1, 1],
[3, 3, 3, 3, 3, 3],
[2, 2, 2, 2, 2, 2],
[9, 9, 9, 9, 9, 9]
]
M = np.transpose(np.array(M))
U,s,Vt = svd(M, full_matrices=False)
print s
Existe uma maneira diferente de fazer isso sem que os Valores Singulares sejam classificados?
Atualizar: Parece que isso pode não ser possível, pelo menos de acordo com este post nos fóruns do Matlab:http://www.mathworks.com/matlabcentral/newsreader/view_thread/241607. Se alguém souber o contrário, me avise :)