Resultados de la búsqueda a petición "scikit-learn"
sklearn muestreo estratificado basado en una columna
Tengo un archivo CSV bastante grande que contiene datos de revisión de Amazon que leí en un marco de datos de pandas. Quiero dividir los datos 80-20 (prueba de tren) pero al hacerlo quiero asegurarme de que los datos divididos representen ...
Sklearn plot confusión matriz con etiquetas
Quiero trazar una matriz de confusión para visualizar el rendimiento del clasificador, pero muestra solo los números de las etiquetas, no las etiquetas en sí:
Utilice el PDF scikit-learn con gensim LDA
He usado varias versiones de TFIDF en scikit para modelar algunos datos de texto.
¿Cuál es la forma más sencilla de obtener tfidf con el marco de datos de pandas?
Quiero calcular tf-idf a partir de los documentos a continuación. Estoy usando python y pandas. import pandas as pd df = pd.DataFrame({'docId': [1,2,3], 'sent': ['This is the first sentence','This is the second sentence', 'This is the third ...
Scikit Learn - ValueError: Array contiene NaN o infinito
No hay NaNs en mi conjunto de datos, lo he comprobado a fondo. ¿Alguna razón por la que sigo recibiendo este error al intentar ajustar mi clasificador? Algun...
ValueError: las dimensiones negativas no están permitidas
Estoy jugando con algunos datos de una competencia de Kaggle en text_analysis, y continúo recibiendo este error bastante extraño descrito en el título cada v...
Advertencia de desaprobación en scikit-learn svmlight format loader
Recibo una nueva advertencia de desaprobación en un cuaderno de IPython que escribí y que no he visto antes. Lo que estoy viendo es lo siguiente: