Resultados de la búsqueda a petición "scikit-learn"

4 la respuesta

Recuperación de nombres de características de explicación_varianza_ratio_ en PCA con sklearn

Estoy tratando de recuperarme de una PCA realizada con scikit-learn,cuallas características se seleccionan comopertinente. Un ejemplo clásico con el conjunto de datos IRIS. import pandas as pd import pylab as pl from sklearn import datasets ...

2 la respuesta

Advertencias de desaprobación de sklearn

estoy usandocross_validation de sklearn, from sklearn.cross_validation import train_test_splitRecibo la siguiente advertencia: cross_validation.py:44: DeprecationWarning: este módulo fue desaprobado en la versión 0.18 a favor del módulo ...

1 la respuesta

La función tfidf.transform () no devuelve los valores correctos

Estoy tratando de ajustar el vectorizador tfidf en un determinado corpus de texto y luego usar el mismo vectorizador para encontrar la suma de los valores tfidf del nuevo texto. Sin embargo, los valores suma no son los esperados. A continuación ...

1 la respuesta

Predecir cierta etiqueta con la mayor probabilidad posible en regresión logística

Estoy construyendo el modelo, teniendo 12 parámetros y {0,1} etiquetas usando regresión logística en sklearn. Necesito tener mucha confianza en la etiqueta 0, estoy bien si algún '0' se clasificará erróneamente en 1. El propósito de esto es que ...

2 la respuesta

Columnas pandas específicas como argumentos en la nueva columna de salidas df.apply

Dado un marco de datos de pandas de la siguiente manera: import pandas as pd from sklearn.metrics import mean_squared_error df = pd.DataFrame.from_dict( {'row': ['a','b','c','d','e','y'], 'a': [ 0, -.8,-.6,-.3, .8, .01], 'b': [-.8, 0, .5, ...

1 la respuesta

Sklearn: ROC para clasificación multiclase

Estoy haciendo diferentes experimentos de clasificación de texto. Ahora necesito calcular el AUC-ROC para cada tarea. Para las clasificaciones binarias, ya lo hice funcionar con este código: scaler = StandardScaler(with_mean=False) enc = ...

4 la respuesta

Etiqueta que codifica múltiples columnas con la misma categoría

Considere el siguiente marco de datos: import pandas as pd from sklearn.preprocessing import LabelEncoder df = pd.DataFrame(data=[["France", "Italy", "Belgium"], ["Italy", "France", "Belgium"]], columns=["a", "b", "c"]) df ...

1 la respuesta

k vecinos más cercanos con validación cruzada para puntaje de precisión y matriz de confusión

Tengo los siguientes datos donde para cada columna, las filas con números son la entrada y la letra es la ...

1 la respuesta

¿Por qué Random Forest con un solo árbol es mucho mejor que un clasificador de árbol de decisión?

Aprendo el aprendizaje automático con elscikit-learn biblioteca. Aplico el clasificador de árbol de decisión y el clasificador de bosque aleatorio a mis datos con este código: def decision_tree(train_X, train_Y, test_X, test_Y): clf ...

2 la respuesta

¿Cómo generar el clasificador RandomForest desde python?

He entrenado un RandomForestClassifier de Python Sckit Learn Module con un conjunto de datos muy grande, pero la pregunta es cómo puedo guardar este modelo y dejar que otras personas lo apliquen. ¡Gracias!