Resultados de la búsqueda a petición "scikit-learn"
¿Cómo obtener la curva ROC para el árbol de decisión?
Estoy tratando de encontrarCurva ROC yCurva AUROC para el árbol de decisión. Mi código era algo como clf.fit(x,y) y_score = clf.fit(x,y).decision_function(test[col]) pred ...
Scikit-learn GridSearchCV no se ajusta al modelo EM con silhouette_score debido a TypeError críptico
El siguiente código da como resultado:TypeError: __call__() takes at least 4 arguments (3 given). He instanciado un clasificador de clúster y un método de puntuación creado apropiado para la agrupación. He proporcionado un conjunto de datos ...
LabelEncoder: TypeError: '>' no es compatible entre instancias de 'float' y 'str'
Estoy enfrentando este error para múltiples variables, incluso tratando valores perdidos. Por ejemplo: le = preprocessing.LabelEncoder() categorical = list(df.select_dtypes(include=['object']).columns.values) for cat in categorical: print(cat) ...
Tubería "paralela" para obtener el mejor modelo usando gridsearch
En sklearn, se puede definir una tubería en serie para obtener la mejor combinación de hiperparámetros para todas las partes consecutivas de la tubería. Una tubería en serie se puede implementar de la siguiente manera: from sklearn.svm import ...
¿Cómo obtener predicciones con XGBoost y XGBoost usando Scikit-Learn Wrapper para que coincida?
Soy nuevo en XGBoost en Python, así que me disculpo si la respuesta aquí es obvia, pero estoy tratando de tomar un marco de datos de panda y obtener XGBoost en Python para darme las mismas predicciones que obtengo cuando uso el contenedor ...
El indicador de múltiples capas no es compatible con la matriz de confusión
multilabel-indicator is not supported es el mensaje de error que recibo cuando intento ejecutar: confusion_matrix(y_test, predictions) y_test es unDataFrame que es de forma: Horse | Dog | Cat 1 0 0 0 1 0 0 1 0 ... ... ...predictions es unnumpy ...
Búsqueda de cuadrícula y detención temprana mediante la validación cruzada con XGBoost en SciKit-Learn
Soy bastante nuevo en el aprendizaje de sci-kit y he estado tratando de sintonizar hiperparámetro XGBoost. Mi objetivo es usar la detención temprana y la búsqueda de cuadrícula para ajustar los parámetros del modelo y usar la detención temprana ...
Diferencia entre min_samples_split y min_samples_leaf en sklearn DecisionTreeClassifier
Estaba pasando por la clase de sklearnDecisionTreeClassifier [http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html] . Mirando los parámetros para la clase, tenemos dos ...
Scikit-learn labelencoder: ¿cómo preservar las asignaciones entre lotes?
Tengo 185 millones de muestras que serán aproximadamente 3.8 MB por muestra. Para preparar mi conjunto de datos, necesitaré codificar en caliente muchas de las funciones, después de lo cual termino con más de 15,000 funciones. Pero necesito ...
Error al intentar instalar sklearn desde Pycharm | arrayobject.h no puede ser absoluto
Declaración de error completa: ValueError: la ruta '/home/andy/anaconda3/lib/python3.5/sitepackages/numpy/core/include/numpy/arrayobject.h' no puede ser absoluta He instalado la versión Scipy y numpy (mkl) descargando los archivos de ...