Resultados de la búsqueda a petición "scikit-learn"

2 la respuesta

Cómo obtener el mejor estimador en GridSearchCV (Random Forest Classifier Scikit)

Estoy ejecutando GridSearch CV para optimizar los parámetros de un clasificador en scikit. Una vez que termine, me gustaría saber qué parámetros se eligieron como los mejores. Cada vez que lo hago me sale unAttributeError: ...

3 la respuesta

clasificadores en scikit-learn que manejan nan / null

Me preguntaba si hay clasificadores que manejan valores nan / nulos en scikit-learn. Pensé que el regresor forestal aleatorio maneja esto, pero recibí un error cuando llamopredict. X_train = np.array([[1, np.nan, 3],[np.nan, 5, 6]]) y_train = ...

5 la respuesta

RandomForestClassfier.fit (): ValueError: no se pudo convertir la cadena en flotante

Dado es un simple archivo CSV: A,B,C Hello,Hi,0 Hola,Bueno,1Obviamente, el conjunto de datos real es mucho más complejo que esto, pero este reproduce el error. Estoy intentando construir un clasificador de bosque aleatorio para ello, así: cols ...

7 la respuesta

Error al importar módulos scikit-learn

Estoy tratando de llamar a una función desde el módulo del clúster, así: import sklearn db = sklearn.cluster.DBSCAN()y me sale el siguiente error: AttributeError: 'module' object has no attribute 'cluster'Al completar las pestañas en IPython, ...

4 la respuesta

Aprendizaje incremental en Scikit con PassiveAggressiveClassifier's partial_fit

Estoy tratando de entrenar a unPassiveAggressiveClassifier utilizandoTfidVectorizer conpartial_fit técnica en el guión a continuación: Código actualizado: a, ta = [], [] r, tr = [], [] g = [] vect = HashingVectorizer(ngram_range=(1,4)) model = ...

2 la respuesta

Cómo especificar la probabilidad previa de naive bayes de scikit-learn

Estoy usando la biblioteca de aprendizaje automático scikit-learn (Python) para un proyecto de aprendizaje automático. Uno de los algoritmos que estoy usando es la implementación Gaussian Naive Bayes. Uno de los atributos de laGaussianNB () La ...

1 la respuesta

Guarde y reutilice TfidfVectorizer en scikit learn

Estoy usando TfidfVectorizer en scikit learn para crear una matriz a partir de datos de texto. Ahora necesito guardar este objeto para reutilizarlo más tarde. Intenté usar pickle, pero me dio el siguiente error. loc=open('vectorizer.obj','w') ...

1 la respuesta

¿Cómo funciona el parámetro class_weight en scikit-learn?

Tengo muchos problemas para entender cómoclass_weight opera el parámetro en la Regresión logística de scikit-learn. La situación Quiero usar la regresión logística para hacer una clasificación binaria en un conjunto de datos muy desequilibrado. ...

1 la respuesta

¿Debo usar `random.seed` o` numpy.random.seed` para controlar la generación de números aleatorios en `scikit-learn`?

Estoy usando scikit-learn y numpy y quiero establecer la semilla global para que mi trabajo sea reproducible. Debería usarnumpy.random.seed orandom.seed? Editar:Desde el enlace en los comentarios, entiendo que son diferentes, y que la versión ...

2 la respuesta

¿GridSearchCV realiza validación cruzada?

Actualmente estoy trabajando en un problema que compara el rendimiento de tres algoritmos de aprendizaje automático diferentes en el mismo conjunto de datos. Dividí el conjunto de datos en 70/30 conjuntos de entrenamiento / prueba y luego realicé ...