Resultados de la búsqueda a petición "categorical-data"

2 la respuesta

Cambiar el nombre de las categorías menos frecuentes por "OTRO" python

En mi marco de datos tengo algunas columnas categóricas con más de 100 categorías diferentes. Quiero clasificar las categorías por las más frecuentes. Mantengo las primeras 9 categorías más frecuentes y las categorías menos frecuentes las ...

3 la respuesta

¿Cómo correlacionar la columna categórica en pandas?

Tengo un DataFramedf con una columna no numéricaCatColumn. A B CatColumn 0 381.1396 7.343921 Medium 1 481.3268 6.786945 Medium 2 263.3766 7.628746 High 3 177.2400 5.225647 Medium-HighQuiero incluirCatColumn en el análisis de correlación con ...

1 la respuesta

Factoriza una columna de cadenas en pandas

Como dice la pregunta, tengo un marco de datosdf_original que es bastante grande pero se ve así: ID Count Column 2 Column 3 Column 4 RowX 1 234. 255. yes. 452 RowY 1 123. 135. no. 342 RowW 1 234. 235. yes. 645 RowJ 1 123. 115. no. 342 RowA 1 ...

1 la respuesta

¿Cómo maneja Tensorflow las funciones categóricas con múltiples entradas dentro de una columna?

Por ejemplo, tengo datos en lo siguientecsv formato: csv col0 col1 col2 col3 1 A E|A|C 3 0 B D|F 2 2 C | 2Cada columna separada por comas representa una característica. Normalmente, una característica es única (p. Ej.col0, col1, col3), pero en ...

0 la respuesta

Búsqueda de incrustación de Tensorflow con listas de tamaños desiguales

Hej chicos, estoy tratando de proyectar datos categóricos multi etiquetados en un espacio denso usando incrustaciones. Aquí hay un ejemplo de juguete. Digamos que tengo cuatro categorías y quiero proyectarlas en un espacio 2D. Además, obtuve dos ...

1 la respuesta

pd.get_dummies () ralentiza en niveles grandes

No estoy seguro de si este es el método más rápido posible, o si lo estoy haciendo de manera ineficiente. Quiero codificar en caliente una columna categórica particular que tiene 27k + niveles posibles. La columna tiene valores diferentes en 2 ...

6 la respuesta

¿Alguna forma de obtener asignaciones de un codificador de etiquetas en pandas Python?

Estoy convirtiendo cadenas en valores categóricos en mi conjunto de datos utilizando el siguiente fragmento de código. data['weekday'] = pd.Categorical.from_array(data.weekday).labelsPor ejemplo, index weekday 0 Sunday 1 Sunday 2 Wednesday 3 ...

1 la respuesta

Revelar características del clúster k-modes

Estoy realizando un análisis de clúster en datos categóricos, por lo tanto, uso el enfoque de modos k. Mis datos tienen la forma de una encuesta de preferencias: ¿Qué le parece el cabello y los ojos? [/imgs/6T7QR.png] El encuestado puede ...

4 la respuesta

¿Cómo codificar características categóricas en sklearn?

Tengo un conjunto de datos con 41 características [de 0 a 40 columnas], de las cuales 7 son categóricas. Este conjunto categórico se divide en dos subconjuntos: Un subconjunto de tipo de cadena (las características de columna 1, 2, ...

4 la respuesta

Reduce el número de niveles para grandes variables categóricas

¿Hay algunas bibliotecas o paquetes listos para usar para python o R para reducir el número de niveles para grandes factores categóricos? Quiero lograr algo similar aR: variables categóricas de ...