Resultados de la búsqueda a petición "pca"
¿Es posible aplicar PCA en cualquier clasificación de texto?
Estoy intentando una clasificación con python. Estoy usando el clasificador Naive Bayes MultinomialNB para las páginas web (Recuperando datos de la web a texto, luego clasifico este texto: clasificación web). Ahora, estoy tratando de aplicar PCA ...
Realización de PCA en una matriz dispersa grande utilizando sklearn
Estoy tratando de aplicar PCA en una gran matriz dispersa, en el siguiente enlace dice que randomizedPCA de sklearn puede manejar una matriz dispersa de formato disperso scipy.Aplique PCA en una matriz dispersa muy ...
Pyspark y PCA: ¿Cómo puedo extraer los vectores propios de esta PCA? ¿Cómo puedo calcular cuánta varianza están explicando?
Estoy reduciendo la dimensionalidad de unSpark DataFrame conPCA modelo con pyspark (utilizando elspark ml biblioteca) de la siguiente manera: pca = PCA(k=3, inputCol="features", outputCol="pca_features") model = pca.fit(data)dóndedata es unSpark ...
Python scikit learn pca.explained_variance_ratio_ cutoff
Gurú, Al elegir el número de componentes principales (k), elegimos k para que sea el valor más pequeño de modo que, por ejemplo, se retenga el 99% de la varianza. Sin embargo, en Python Scikit learn, ¿no estoy 100% seguro de ...
Usar archivos de memmap para el procesamiento por lotes
Tengo un gran conjunto de datos en el que deseo PCA. Estoy limitado por la RAM y la eficiencia computacional de PCA. Por lo tanto, cambié a usar PCA iterativo. Tamaño del conjunto de datos: ...
¿Cómo implementar ZCA Whitening? Pitón
Estoy tratando de implementarBlanqueamiento ZCAy encontré algunos artículos para hacerlo, pero son un poco confusos ... ¿alguien puede iluminarme? Cualquier sugerencia o ayuda es apreciada! Aquí están los artículos que ...
PCA incremental en big data
Acabo de intentar usar el IncrementalPCA de sklearn.decomposition, pero arrojó un MemoryError al igual que el PCA y RandomizedPCA antes. Mi problema es que la matriz que estoy tratando de cargar es demasiado grande para caber en la RAM. En este ...
Reducción de dimensionalidad en Matlab
Quiero reducir la dimensión de datos a dimensiones ndim en MATLAB. estoy usandopcares para reducir la dimensión pero el resultado (es decir, residuales, reconstruidos) tiene las mismas dimensiones que los datos y nondim. ¿Cómo puedo proyectar los ...
Seleccionar múltiples columnas / filas impares o pares para el marco de datos
¿Hay alguna forma en R de seleccionar muchas filas / columnas no consecutivas, es decir, pares o impares? Estoy trazando las cargas para mi análisis de componentes principales. Tengo 84 filas de datos ordenados, d así:x_1 y_1 x_2.....x_42 ...
Recuperación de nombres de características de explicación_varianza_ratio_ en PCA con sklearn
Estoy tratando de recuperarme de una PCA realizada con scikit-learn,cuallas características se seleccionan comopertinente. Un ejemplo clásico con el conjunto de datos IRIS. import pandas as pd import pylab as pl from sklearn import datasets ...