Resultados de la búsqueda a petición "scikit-learn"
Recuperación de nombres de características de explicación_varianza_ratio_ en PCA con sklearn
Estoy tratando de recuperarme de una PCA realizada con scikit-learn,cuallas características se seleccionan comopertinente. Un ejemplo clásico con el conjunto de datos IRIS. import pandas as pd import pylab as pl from sklearn import datasets ...
Advertencias de desaprobación de sklearn
estoy usandocross_validation de sklearn, from sklearn.cross_validation import train_test_splitRecibo la siguiente advertencia: cross_validation.py:44: DeprecationWarning: este módulo fue desaprobado en la versión 0.18 a favor del módulo ...
La función tfidf.transform () no devuelve los valores correctos
Estoy tratando de ajustar el vectorizador tfidf en un determinado corpus de texto y luego usar el mismo vectorizador para encontrar la suma de los valores tfidf del nuevo texto. Sin embargo, los valores suma no son los esperados. A continuación ...
Predecir cierta etiqueta con la mayor probabilidad posible en regresión logística
Estoy construyendo el modelo, teniendo 12 parámetros y {0,1} etiquetas usando regresión logística en sklearn. Necesito tener mucha confianza en la etiqueta 0, estoy bien si algún '0' se clasificará erróneamente en 1. El propósito de esto es que ...
Columnas pandas específicas como argumentos en la nueva columna de salidas df.apply
Dado un marco de datos de pandas de la siguiente manera: import pandas as pd from sklearn.metrics import mean_squared_error df = pd.DataFrame.from_dict( {'row': ['a','b','c','d','e','y'], 'a': [ 0, -.8,-.6,-.3, .8, .01], 'b': [-.8, 0, .5, ...
Sklearn: ROC para clasificación multiclase
Estoy haciendo diferentes experimentos de clasificación de texto. Ahora necesito calcular el AUC-ROC para cada tarea. Para las clasificaciones binarias, ya lo hice funcionar con este código: scaler = StandardScaler(with_mean=False) enc = ...
Etiqueta que codifica múltiples columnas con la misma categoría
Considere el siguiente marco de datos: import pandas as pd from sklearn.preprocessing import LabelEncoder df = pd.DataFrame(data=[["France", "Italy", "Belgium"], ["Italy", "France", "Belgium"]], columns=["a", "b", "c"]) df ...
k vecinos más cercanos con validación cruzada para puntaje de precisión y matriz de confusión
Tengo los siguientes datos donde para cada columna, las filas con números son la entrada y la letra es la ...
¿Por qué Random Forest con un solo árbol es mucho mejor que un clasificador de árbol de decisión?
Aprendo el aprendizaje automático con elscikit-learn biblioteca. Aplico el clasificador de árbol de decisión y el clasificador de bosque aleatorio a mis datos con este código: def decision_tree(train_X, train_Y, test_X, test_Y): clf ...
¿Cómo generar el clasificador RandomForest desde python?
He entrenado un RandomForestClassifier de Python Sckit Learn Module con un conjunto de datos muy grande, pero la pregunta es cómo puedo guardar este modelo y dejar que otras personas lo apliquen. ¡Gracias!