Resultados de la búsqueda a petición "scikit-learn"

1 la respuesta

Error de memoria al intentar aplicar 'fit_transform ()' en TFidfVectorizer que contiene la columna Pandas Dataframe (que contiene cadenas)

Estoy intentando una operación similar a la que se muestraaquí [https://stackoverflow.com/questions/39303912/tfidfvectorizer-in-scikit-learn-valueerror-np-nan-is-an-invalid-document] . Comienzo leyendo en dos columnas de un archivo CSV que ...

1 la respuesta

Buena curva ROC pero pobre curva de recuperación de precisión

Tengo algunos resultados de aprendizaje automático que no entiendo del todo. Estoy usando python sciki-learn, con más de 2 millones de datos de aproximadamente 14 características. La clasificación de 'ab' se ve bastante mal en la curva de ...

3 la respuesta

actualizar a la versión de desarrollo de scikit-learn en Anaconda?

Estoy usando Python a través de Anaconda, y me gustaría usar una nueva función ( http://scikit-learn.org/dev/modules/neural_networks_supervised.html [http://scikit-learn.org/dev/modules/neural_networks_supervised.html]) en scikit-learn que ...

2 la respuesta

Realización de PCA en una matriz dispersa grande utilizando sklearn

Estoy tratando de aplicar PCA en una gran matriz dispersa, en el siguiente enlace dice que randomizedPCA de sklearn puede manejar una matriz dispersa de formato disperso scipy.Aplique PCA en una matriz dispersa muy ...

3 la respuesta

¿Cuál es la diferencia entre cross_val_score con scoring = 'roc_auc' y roc_auc_score?

Estoy confundido acerca de la diferencia entre la métrica de puntuación cross_val_score 'roc_auc' y la roc_auc_score que solo puedo importar y llamar directamente. La documentación ...

1 la respuesta

Python: genera una matriz de autocorrelación específica

Estoy interesado en generar una matriz (o serie numpy) de longitud N que exhibirá una autocorrelación específica en el rezago 1. Idealmente, también quiero especificar la media y la varianza, y obtener los datos de la distribución (múltiple) ...

2 la respuesta

sklearn: validación cruzada definida por el usuario para datos de series temporales

Estoy tratando de resolver un problema de aprendizaje automático. Tengo un conjunto de datos específico conseries de tiempo elemento. Para este problema estoy usando la conocida biblioteca de Python:sklearn. Hay muchos iteradores de validación ...

1 la respuesta

¿Cómo encontrar la importancia de las características para un modelo de regresión logística?

Tengo un modelo de predicción binaria entrenado por el algoritmo de regresión logística. Quiero saber qué características (predictores) son más importantes para la decisión de clase positiva o negativa. Yo se que haycoef_ El parámetro proviene ...

5 la respuesta

Se pasó una columna-vector y cuando se esperaba una matriz 1d

Necesito encajarRandomForestRegressor desklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold)Este código siempre funcionó hasta que hice un ...

3 la respuesta

Python RandomForest - Error de etiqueta desconocido

Tengo problemas para usar la función de ajuste RandomForest Este es mi set de entrenamiento P1 Tp1 IrrPOA Gz Drz2 0 0.0 7.7 0.0 -1.4 -0.3 1 0.0 7.7 0.0 -1.4 -0.3 2 ... ... ... ... ... 3 49.4 7.5 0.0 -1.4 -0.3 4 47.4 7.5 0.0 -1.4 -0.3 ... (10k ...