Resultados de la búsqueda a petición "scikit-learn"

1 la respuesta

¿Cómo trasladar el modelo de tren a producción?

He finalizado un modelo y está funcionando dentro de límites aceptables. Estoy usando python y scitkit-learn específicamente. Lo siguiente es mover el modelo a producción. ¿Puedo solicitar ayuda para mover estos modelos a producción? ¿Cómo ...

1 la respuesta

error de forma inconsistente MultiLabelBinarizer en y_test, sklearn clasificación multi-etiqueta

import numpy as np import pandas as pd from sklearn.pipeline import Pipeline from sklearn.feature_extraction.text import CountVectorizer from sklearn.svm import LinearSVC from sklearn.linear_model import SGDClassifier ...

2 la respuesta

Obteniendo un bajo puntaje ROC AUC pero una alta precisión

Usando unLogisticRegression clase enscikit-learn en una versión de laconjunto de datos de retraso de vuelo [https://www.kaggle.com/usdot/flight-delays/data]. yo suelopandas para seleccionar algunas columnas: df = df[["MONTH", "DAY_OF_MONTH", ...

2 la respuesta

Característica personalizada ¿Unión no funcionará?

Estoy tratando de modificaresta [http://scikit-learn.org/stable/auto_examples/hetero_feature_union.html]ejemplo para usar un marco de datos Pandas en lugar de los conjuntos de datos de prueba. No puedo hacerlo, ya queItemSelector no parece ...

1 la respuesta

Cálculo de ganancia de información con Scikit-learn

Estoy usando Scikit-learn para la clasificación de texto. Quiero calcular la ganancia de información para cada atributo con respecto a una clase en una matriz de término de documento (dispersa). La ganancia de información se define como H (Clase) ...

2 la respuesta

Python: MemoryError al calcular la similitud de coseno tf-idf entre dos columnas en Pandas

Estoy tratando de calcular la similitud del coseno del vector tf-idf entre dos columnas en un marco de datos Pandas. Una columna contiene una consulta de búsqueda, la otra contiene un título de producto. El valor de similitud de coseno pretende ...

1 la respuesta

¿Cómo asignar una nueva observación a los clústeres de Kmeans existentes basados en la lógica de centrípodos de clúster más cercana en Python?

Utilicé el siguiente código para crear clústeres de k-means utilizando Scikit learn. kmean = KMeans(n_clusters=nclusters,n_jobs=-1,random_state=2376,max_iter=1000,n_init=1000,algorithm='full',init='k-means++') kmean_fit = ...

2 la respuesta

Diferencia entre cross_val_score y cross_val_predict

Quiero evaluar una construcción de modelo de regresión con scikitlearn usando validación cruzada y confundiéndome, ¿cuál de las dos funcionescross_val_score ycross_val_predict Debería usar Una opción sería: cvs = DecisionTreeRegressor(max_depth ...

5 la respuesta

¿Cómo codificar frases en el nivel de personaje?

Me gustaría convertir una oración a una matriz de vectores de un solo hot. Estos vectores serían la representación única del alfabeto. Se vería así: "hello" # h=7, e=4 l=11 o=14se convertiría [[0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, ...

1 la respuesta

¿Qué coeficientes van a qué clase en regresión logística multiclase en scikit learn?

Estoy usando la Regresión logística de scikit learn para un problema multiclase. logit = LogisticRegression(penalty='l1') logit = logit.fit(X, y)Estoy interesado en las características que impulsan esta decisión. logit.coef_Lo anterior me da un ...