Wie kann ich PCA / SVD in Python zur Funktionsauswahl UND -identifizierung verwenden?
Ich folgeHauptkomponentenanalyse in Python PCA unter Python zu verwenden, aber mit der Bestimmung zu kämpfenwelche zu wählende Merkmale (d. h. welche meiner Spalten / Merkmale die beste Varianz aufweisen).
Wenn ich benutzescipy.linalg.svd
sortiert automatisch meine Singular-Werte, sodass ich nicht erkennen kann, zu welcher Spalte sie gehören.
Beispielcode:
import numpy as np
from scipy.linalg import svd
M = [
[1, 1, 1, 1, 1, 1],
[3, 3, 3, 3, 3, 3],
[2, 2, 2, 2, 2, 2],
[9, 9, 9, 9, 9, 9]
]
M = np.transpose(np.array(M))
U,s,Vt = svd(M, full_matrices=False)
print s
Gibt es einen anderen Weg, dies zu tun, ohne die Singular Values zu sortieren?
Aktualisieren: Es sieht so aus, als wäre dies möglicherweise nicht möglich, zumindest laut diesem Beitrag in den Matlab-Foren:http://www.mathworks.com/matlabcentral/newsreader/view_thread/241607. Wenn jemand etwas anderes weiß, lass es mich wissen :)