Resultados de la búsqueda a petición "pca"

2 la respuesta

¿Es posible aplicar PCA en cualquier clasificación de texto?

Estoy intentando una clasificación con python. Estoy usando el clasificador Naive Bayes MultinomialNB para las páginas web (Recuperando datos de la web a texto, luego clasifico este texto: clasificación web). Ahora, estoy tratando de aplicar PCA ...

2 la respuesta

Realización de PCA en una matriz dispersa grande utilizando sklearn

Estoy tratando de aplicar PCA en una gran matriz dispersa, en el siguiente enlace dice que randomizedPCA de sklearn puede manejar una matriz dispersa de formato disperso scipy.Aplique PCA en una matriz dispersa muy ...

1 la respuesta

Pyspark y PCA: ¿Cómo puedo extraer los vectores propios de esta PCA? ¿Cómo puedo calcular cuánta varianza están explicando?

Estoy reduciendo la dimensionalidad de unSpark DataFrame conPCA modelo con pyspark (utilizando elspark ml biblioteca) de la siguiente manera: pca = PCA(k=3, inputCol="features", outputCol="pca_features") model = pca.fit(data)dóndedata es unSpark ...

2 la respuesta

Python scikit learn pca.explained_variance_ratio_ cutoff

Gurú, Al elegir el número de componentes principales (k), elegimos k para que sea el valor más pequeño de modo que, por ejemplo, se retenga el 99% de la varianza. Sin embargo, en Python Scikit learn, ¿no estoy 100% seguro de ...

2 la respuesta

Usar archivos de memmap para el procesamiento por lotes

Tengo un gran conjunto de datos en el que deseo PCA. Estoy limitado por la RAM y la eficiencia computacional de PCA. Por lo tanto, cambié a usar PCA iterativo. Tamaño del conjunto de datos: ...

5 la respuesta

¿Cómo implementar ZCA Whitening? Pitón

Estoy tratando de implementarBlanqueamiento ZCAy encontré algunos artículos para hacerlo, pero son un poco confusos ... ¿alguien puede iluminarme? Cualquier sugerencia o ayuda es apreciada! Aquí están los artículos que ...

1 la respuesta

PCA incremental en big data

Acabo de intentar usar el IncrementalPCA de sklearn.decomposition, pero arrojó un MemoryError al igual que el PCA y RandomizedPCA antes. Mi problema es que la matriz que estoy tratando de cargar es demasiado grande para caber en la RAM. En este ...

2 la respuesta

Reducción de dimensionalidad en Matlab

Quiero reducir la dimensión de datos a dimensiones ndim en MATLAB. estoy usandopcares para reducir la dimensión pero el resultado (es decir, residuales, reconstruidos) tiene las mismas dimensiones que los datos y nondim. ¿Cómo puedo proyectar los ...

4 la respuesta

Seleccionar múltiples columnas / filas impares o pares para el marco de datos

¿Hay alguna forma en R de seleccionar muchas filas / columnas no consecutivas, es decir, pares o impares? Estoy trazando las cargas para mi análisis de componentes principales. Tengo 84 filas de datos ordenados, d así:x_1 y_1 x_2.....x_42 ...

4 la respuesta

Recuperación de nombres de características de explicación_varianza_ratio_ en PCA con sklearn

Estoy tratando de recuperarme de una PCA realizada con scikit-learn,cuallas características se seleccionan comopertinente. Un ejemplo clásico con el conjunto de datos IRIS. import pandas as pd import pylab as pl from sklearn import datasets ...