Resultados de la búsqueda a petición "scikit-learn"

2 la respuesta

¿Cómo obtener la curva ROC para el árbol de decisión?

Estoy tratando de encontrarCurva ROC yCurva AUROC para el árbol de decisión. Mi código era algo como clf.fit(x,y) y_score = clf.fit(x,y).decision_function(test[col]) pred ...

1 la respuesta

Scikit-learn GridSearchCV no se ajusta al modelo EM con silhouette_score debido a TypeError críptico

El siguiente código da como resultado:TypeError: __call__() takes at least 4 arguments (3 given). He instanciado un clasificador de clúster y un método de puntuación creado apropiado para la agrupación. He proporcionado un conjunto de datos ...

3 la respuesta

LabelEncoder: TypeError: '>' no es compatible entre instancias de 'float' y 'str'

Estoy enfrentando este error para múltiples variables, incluso tratando valores perdidos. Por ejemplo: le = preprocessing.LabelEncoder() categorical = list(df.select_dtypes(include=['object']).columns.values) for cat in categorical: print(cat) ...

1 la respuesta

Tubería "paralela" para obtener el mejor modelo usando gridsearch

En sklearn, se puede definir una tubería en serie para obtener la mejor combinación de hiperparámetros para todas las partes consecutivas de la tubería. Una tubería en serie se puede implementar de la siguiente manera: from sklearn.svm import ...

1 la respuesta

¿Cómo obtener predicciones con XGBoost y XGBoost usando Scikit-Learn Wrapper para que coincida?

Soy nuevo en XGBoost en Python, así que me disculpo si la respuesta aquí es obvia, pero estoy tratando de tomar un marco de datos de panda y obtener XGBoost en Python para darme las mismas predicciones que obtengo cuando uso el contenedor ...

2 la respuesta

El indicador de múltiples capas no es compatible con la matriz de confusión

multilabel-indicator is not supported es el mensaje de error que recibo cuando intento ejecutar: confusion_matrix(y_test, predictions) y_test es unDataFrame que es de forma: Horse | Dog | Cat 1 0 0 0 1 0 0 1 0 ... ... ...predictions es unnumpy ...

1 la respuesta

Búsqueda de cuadrícula y detención temprana mediante la validación cruzada con XGBoost en SciKit-Learn

Soy bastante nuevo en el aprendizaje de sci-kit y he estado tratando de sintonizar hiperparámetro XGBoost. Mi objetivo es usar la detención temprana y la búsqueda de cuadrícula para ajustar los parámetros del modelo y usar la detención temprana ...

1 la respuesta

Diferencia entre min_samples_split y min_samples_leaf en sklearn DecisionTreeClassifier

Estaba pasando por la clase de sklearnDecisionTreeClassifier [http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html] . Mirando los parámetros para la clase, tenemos dos ...

1 la respuesta

Scikit-learn labelencoder: ¿cómo preservar las asignaciones entre lotes?

Tengo 185 millones de muestras que serán aproximadamente 3.8 MB por muestra. Para preparar mi conjunto de datos, necesitaré codificar en caliente muchas de las funciones, después de lo cual termino con más de 15,000 funciones. Pero necesito ...

4 la respuesta

Error al intentar instalar sklearn desde Pycharm | arrayobject.h no puede ser absoluto

Declaración de error completa: ValueError: la ruta '/home/andy/anaconda3/lib/python3.5/sitepackages/numpy/core/include/numpy/arrayobject.h' no puede ser absoluta He instalado la versión Scipy y numpy (mkl) descargando los archivos de ...