Resultados de la búsqueda a petición "scikit-learn"
Error de memoria al intentar aplicar 'fit_transform ()' en TFidfVectorizer que contiene la columna Pandas Dataframe (que contiene cadenas)
Estoy intentando una operación similar a la que se muestraaquí [https://stackoverflow.com/questions/39303912/tfidfvectorizer-in-scikit-learn-valueerror-np-nan-is-an-invalid-document] . Comienzo leyendo en dos columnas de un archivo CSV que ...
Buena curva ROC pero pobre curva de recuperación de precisión
Tengo algunos resultados de aprendizaje automático que no entiendo del todo. Estoy usando python sciki-learn, con más de 2 millones de datos de aproximadamente 14 características. La clasificación de 'ab' se ve bastante mal en la curva de ...
actualizar a la versión de desarrollo de scikit-learn en Anaconda?
Estoy usando Python a través de Anaconda, y me gustaría usar una nueva función ( http://scikit-learn.org/dev/modules/neural_networks_supervised.html [http://scikit-learn.org/dev/modules/neural_networks_supervised.html]) en scikit-learn que ...
Realización de PCA en una matriz dispersa grande utilizando sklearn
Estoy tratando de aplicar PCA en una gran matriz dispersa, en el siguiente enlace dice que randomizedPCA de sklearn puede manejar una matriz dispersa de formato disperso scipy.Aplique PCA en una matriz dispersa muy ...
¿Cuál es la diferencia entre cross_val_score con scoring = 'roc_auc' y roc_auc_score?
Estoy confundido acerca de la diferencia entre la métrica de puntuación cross_val_score 'roc_auc' y la roc_auc_score que solo puedo importar y llamar directamente. La documentación ...
Python: genera una matriz de autocorrelación específica
Estoy interesado en generar una matriz (o serie numpy) de longitud N que exhibirá una autocorrelación específica en el rezago 1. Idealmente, también quiero especificar la media y la varianza, y obtener los datos de la distribución (múltiple) ...
sklearn: validación cruzada definida por el usuario para datos de series temporales
Estoy tratando de resolver un problema de aprendizaje automático. Tengo un conjunto de datos específico conseries de tiempo elemento. Para este problema estoy usando la conocida biblioteca de Python:sklearn. Hay muchos iteradores de validación ...
¿Cómo encontrar la importancia de las características para un modelo de regresión logística?
Tengo un modelo de predicción binaria entrenado por el algoritmo de regresión logística. Quiero saber qué características (predictores) son más importantes para la decisión de clase positiva o negativa. Yo se que haycoef_ El parámetro proviene ...
Se pasó una columna-vector y cuando se esperaba una matriz 1d
Necesito encajarRandomForestRegressor desklearn.ensemble. forest = ensemble.RandomForestRegressor(**RF_tuned_parameters) model = forest.fit(train_fold, train_y) yhat = model.predict(test_fold)Este código siempre funcionó hasta que hice un ...
Python RandomForest - Error de etiqueta desconocido
Tengo problemas para usar la función de ajuste RandomForest Este es mi set de entrenamiento P1 Tp1 IrrPOA Gz Drz2 0 0.0 7.7 0.0 -1.4 -0.3 1 0.0 7.7 0.0 -1.4 -0.3 2 ... ... ... ... ... 3 49.4 7.5 0.0 -1.4 -0.3 4 47.4 7.5 0.0 -1.4 -0.3 ... (10k ...