Resultados de la búsqueda a petición "scikit-learn"
Cómo acelerar LabelEncoder para recodificar una variable categórica en enteros
Tengo un csv grande con dos cadenas por fila en este formulario: g,k a,h c,i j,e d,i i,h b,b d,d i,a d,hLeí en las dos primeras columnas y recodifico las cadenas a enteros de la siguiente manera: import pandas as pd df = pd.read_csv("test.csv", ...
umbrales en roc_curve en scikit learn
Me refiero al siguiente enlace y muestra, y publico el diagrama de la trama desde esta página donde estoy confundido. Mi confusión es que solo hay 4 umbrales, pero parece que la curva roc tiene muchos puntos de datos (> 4 puntos de datos), ...
PCA ¿Para características categóricas?
Según tengo entendido, pensé que PCA solo se puede realizar para funciones continuas. Pero al tratar de entender la diferencia entre la codificación onehot y la codificación de etiquetas llegó a través de una publicación en el ...
¿Cómo codificar características categóricas en sklearn?
Tengo un conjunto de datos con 41 características [de 0 a 40 columnas], de las cuales 7 son categóricas. Este conjunto categórico se divide en dos subconjuntos: Un subconjunto de tipo de cadena (las características de columna 1, 2, ...
Regresión lineal multivariada / múltiple en Scikit Learn?
Tengo un conjunto de datos (dataTrain.csv & dataTest.csv) en archivo .csv con este formato: Temperature(K),Pressure(ATM),CompressibilityFactor(Z) 273.1,24.675,0.806677258 313.1,24.675,0.888394713 ...,...,...Y capaz de construir un modelo de ...
Scikit-learn, GroupKFold con grupos aleatorios?
Estaba usando StratifiedKFold de scikit-learn, pero ahora tengo que estar atento también a los "grupos". Hay una buena función GroupKFold, pero mis datos dependen mucho del tiempo. Tan similar como en la ayuda, es decir, el número de semanas es ...
Tren estratificado / Validación / División de prueba en scikit-learn
Ya hay una descripción aquí de cómo hacer una división de tren / prueba estratificada en scikit a través de train_test_split (Tren estratificado / Prueba de división en ...
¿Cómo codifico en caliente una columna de un marco de datos de pandas?
Estoy tratando de codificar en caliente una columna de un marco de datos. enc = OneHotEncoder() minitable = enc.fit_transform(df["ids"])Pero me estoy poniendo DeprecationWarning: al pasar matrices 1d como datos están en desuso en 0.17 ...
Recupere la lista de nombres de funciones de entrenamiento del clasificador
¿Hay alguna manera de recuperar la lista de nombres de características utilizados para entrenar a un clasificador, una vez que se ha entrenado con elfit ¿método? Me gustaría obtener esta información antes de aplicar a datos no vistos. Los datos ...
RuntimeWarning: el tamaño de numpy.dtype cambió, puede indicar incompatibilidad binaria
Tengo este error al intentar cargar un modelo SVM guardado. He intentado desinstalar sklearn, NumPy y SciPy, reinstalando nuevamente las últimas versiones (usando pip). Todavía recibo este error. ¿Por qué? In [1]: import sklearn; print ...