Resultados de la búsqueda a petición "scikit-learn"

1 la respuesta

sklearn: Cómo acelerar un vectorizador (por ejemplo, Tfidfvectorizer)

Después de realizar un perfil completo de mi programa, he podido señalar que el vectorizador lo está ralentizando. Estoy trabajando en datos de texto, y dos líneas de vectorización tfidf unigram simple ocupan el 99.2% del tiempo total que tarda ...

1 la respuesta

Obtenga el nombre del documento en la matriz scikit-learn tf-idf

He creado una matriz tf-idf pero ahora quiero recuperar las 2 palabras principales para cada documento. Quiero pasar la identificación del documento y debería darme las 2 palabras principales. En este momento, tengo estos datos de muestra: from ...

2 la respuesta

¿Cuál es un buen rango de valores para los hiperparámetros svm.SVC () que se explorarán a través de GridSearchCV ()?

Me encuentro con el problema de que los hiperparámetros de misvm.SVC() son demasiado anchas para que elGridSearchCV() nunca se completa! Una idea es usarRandomizedSearchCV() en lugar. Pero, de nuevo, mi conjunto de datos es relativamente grande, ...

2 la respuesta

¿Cómo usar los núcleos de cadena en scikit-learn?

Estoy tratando de generar un núcleo de cadena que alimente un clasificador de vectores de soporte. Lo probé con una función que calcula el núcleo, algo así def stringkernel(K, G): for a in range(len(K)): for b in range(len(G)): R[a][b] = ...

5 la respuesta

Regresión lineal de Scikit-Learn ¿cómo obtener las características respectivas del coeficiente?

Estoy tratando de realizar una selección de características mediante la evaluación de mis salidas de coeficientes de regresión, y selecciono las características con los coeficientes de mayor magnitud. El problema es que no sé cómo obtener las ...

3 la respuesta

¿Cómo obtener las características más informativas para el clasificador scikit-learn para diferentes clases?

El paquete NLTK proporciona un métodoshow_most_informative_features() para encontrar las características más importantes para ambas clases, con resultados como: contains(outstanding) = True pos : neg = 11.1 : 1.0 contains(seagal) = True neg : ...

1 la respuesta

sklearn PCA.transform ofrece resultados diferentes para diferentes ensayos

Estoy haciendo un PCA usando sklearn.decomposition.PCA. Descubrí que si la matriz de entrada X es grande, los resultados de dos instancias PCA diferentes para PCA.transform no serán los mismos. Por ejemplo, cuando X es una matriz de 100x200, no ...

2 la respuesta

Problemas con la instalación y el uso de scikit-learn en Anaconda

Instalé Anaconda en ventanas de 64 bits y también instalé scikit-learn usando "conda install scikit-learn". Sin embargo, no puedo encontrar scikit-learn cuando imprimo todos los módulos instalados en python, y no puedo importar scikit-learn. Así ...

3 la respuesta

.arff archivos con scikit-learn?

Me gustaría usar unFormato de archivo de relación de atributo [http://www.cs.waikato.ac.nz/ml/weka/arff.html]con scikit-learn para hacer alguna tarea de PNL, ¿es esto posible? ¿Cómo puede usar un.arff archivo conscikit-learn?

1 la respuesta

La capacitación de modelos sklearn en paralelo con joblib bloquea el proceso

Como se sugiere enesta respuesta [https://stackoverflow.com/questions/29589327/train-multiple-models-in-parallel-with-sklearn] , Intenté usar joblib para entrenar varios modelos de scikit-learn en paralelo. import joblib import numpy from ...