Resultados de la búsqueda a petición "scikit-learn"

3 la respuesta

Cómo acelerar LabelEncoder para recodificar una variable categórica en enteros

Tengo un csv grande con dos cadenas por fila en este formulario: g,k a,h c,i j,e d,i i,h b,b d,d i,a d,hLeí en las dos primeras columnas y recodifico las cadenas a enteros de la siguiente manera: import pandas as pd df = pd.read_csv("test.csv", ...

1 la respuesta

umbrales en roc_curve en scikit learn

Me refiero al siguiente enlace y muestra, y publico el diagrama de la trama desde esta página donde estoy confundido. Mi confusión es que solo hay 4 umbrales, pero parece que la curva roc tiene muchos puntos de datos (> 4 puntos de datos), ...

6 la respuesta

PCA ¿Para características categóricas?

Según tengo entendido, pensé que PCA solo se puede realizar para funciones continuas. Pero al tratar de entender la diferencia entre la codificación onehot y la codificación de etiquetas llegó a través de una publicación en el ...

4 la respuesta

¿Cómo codificar características categóricas en sklearn?

Tengo un conjunto de datos con 41 características [de 0 a 40 columnas], de las cuales 7 son categóricas. Este conjunto categórico se divide en dos subconjuntos: Un subconjunto de tipo de cadena (las características de columna 1, 2, ...

1 la respuesta

Regresión lineal multivariada / múltiple en Scikit Learn?

Tengo un conjunto de datos (dataTrain.csv & dataTest.csv) en archivo .csv con este formato: Temperature(K),Pressure(ATM),CompressibilityFactor(Z) 273.1,24.675,0.806677258 313.1,24.675,0.888394713 ...,...,...Y capaz de construir un modelo de ...

1 la respuesta

Scikit-learn, GroupKFold con grupos aleatorios?

Estaba usando StratifiedKFold de scikit-learn, pero ahora tengo que estar atento también a los "grupos". Hay una buena función GroupKFold, pero mis datos dependen mucho del tiempo. Tan similar como en la ayuda, es decir, el número de semanas es ...

2 la respuesta

Tren estratificado / Validación / División de prueba en scikit-learn

Ya hay una descripción aquí de cómo hacer una división de tren / prueba estratificada en scikit a través de train_test_split (Tren estratificado / Prueba de división en ...

1 la respuesta

¿Cómo codifico en caliente una columna de un marco de datos de pandas?

Estoy tratando de codificar en caliente una columna de un marco de datos. enc = OneHotEncoder() minitable = enc.fit_transform(df["ids"])Pero me estoy poniendo DeprecationWarning: al pasar matrices 1d como datos están en desuso en 0.17 ...

3 la respuesta

Recupere la lista de nombres de funciones de entrenamiento del clasificador

¿Hay alguna manera de recuperar la lista de nombres de características utilizados para entrenar a un clasificador, una vez que se ha entrenado con elfit ¿método? Me gustaría obtener esta información antes de aplicar a datos no vistos. Los datos ...

10 la respuesta

RuntimeWarning: el tamaño de numpy.dtype cambió, puede indicar incompatibilidad binaria

Tengo este error al intentar cargar un modelo SVM guardado. He intentado desinstalar sklearn, NumPy y SciPy, reinstalando nuevamente las últimas versiones (usando pip). Todavía recibo este error. ¿Por qué? In [1]: import sklearn; print ...