Resultados de la búsqueda a petición "scikit-learn"

3 la respuesta

¿Crear eficientemente tablas dinámicas dispersas en pandas?

Estoy trabajando convirtiendo una lista de registros con dos columnas (A y B) en una representación matricial. He estado usando la función pivote dentro de los pandas, pero el resultado termina siendo bastante grande. ¿Los pandas admiten pivotar ...

4 la respuesta

Hacer que SVM se ejecute más rápido en Python

Utilizando lacódigoa continuación para svm en python: from sklearn import datasets from sklearn.multiclass import OneVsRestClassifier from sklearn.svm import SVC iris = datasets.load_iris() X, y = iris.data, iris.target clf = ...

4 la respuesta

¿Por qué obtengo un ImportError al compilar un .exe con pyinstaller?

Acabo de crear un pequeño programa GUI que compila y funciona bien en IPython, pero cuando trato de exportarlo a un.exe usando pyinstaller me da un error de importación. Estoy seguro de que essklearn porque cuando comento elsklearn Importa mi ...

1 la respuesta

Cargar datos del clasificador en escabeche: Vocabulario no ajustado Error

He leído todas las preguntas relacionadas aquí, pero no pude encontrar una solución que funcione: Mi creación de clasificador: class StemmedTfidfVectorizer(TfidfVectorizer): def build_analyzer(self): analyzer = super(TfidfVectorizer, ...

1 la respuesta

¿Cómo usar el CountVectorizerand () de sklearn para obtener ngrams que incluyen cualquier puntuación como tokens separados?

yo suelosklearn.feature_extraction.text.CountVectorizer [http://scikit-learn.org/stable/modules/generated/sklearn.feature_extraction.text.CountVectorizer.html] para calcular n-gramos. Ejemplo: import sklearn.feature_extraction.text # ...

2 la respuesta

Problemas con una codificación binaria one-hot (one-of-K) en python

La codificación binaria one-hot (también conocida como una de K) reside en hacer una columna binaria para cada valor distinto para una variable categórica. Por ejemplo, si uno tiene una columna de color (variable categórica) que toma los valores ...

2 la respuesta

Usar archivos de memmap para el procesamiento por lotes

Tengo un gran conjunto de datos en el que deseo PCA. Estoy limitado por la RAM y la eficiencia computacional de PCA. Por lo tanto, cambié a usar PCA iterativo. Tamaño del conjunto de datos: ...

7 la respuesta

Cómo explorar un árbol de decisión creado con scikit learn

Estoy construyendo un árbol de decisión usando clf = tree.DecisionTreeClassifier() clf = clf.fit(X_train, Y_train)Todo esto funciona bien. Sin embargo, ¿cómo exploro el árbol de decisión? Por ejemplo, ¿cómo encuentro qué entradas de X_train ...

1 la respuesta

sklearn partial_fit () no muestra resultados precisos como fit ()

Estoy entrenando 3 listas de datos L1, L2, L3. Primero los entreno a todos con SGDClassifier fit () y luego instancia por instancia con partial_fit (). Yo pruebo los datos con L4, L5. [Los datos en las listas son datos de imagen y las imágenes ...

2 la respuesta

Diferentes tipos de características para entrenar Naive Bayes en Python Pandas

Me gustaría utilizar una serie de características para entrenar con el clasificador Naive Bayes para clasificar 'A' o 'no A'. Tengo tres características de diferentes tipos de valores: 1) longitud_total - en entero positivo 2) relación vocal - ...