Resultados de la búsqueda a petición "categorical-data"

1 la respuesta

¿Cómo maneja Tensorflow las funciones categóricas con múltiples entradas dentro de una columna?

Por ejemplo, tengo datos en lo siguientecsv formato: csv col0 col1 col2 col3 1 A E|A|C 3 0 B D|F 2 2 C | 2Cada columna separada por comas representa una característica. Normalmente, una característica es única (p. Ej.col0, col1, col3), pero en ...

4 la respuesta

¿Cómo codificar características categóricas en sklearn?

Tengo un conjunto de datos con 41 características [de 0 a 40 columnas], de las cuales 7 son categóricas. Este conjunto categórico se divide en dos subconjuntos: Un subconjunto de tipo de cadena (las características de columna 1, 2, ...

1 la respuesta

R: expandir un factor R en columnas ficticias para cada nivel de factor

Tengo un marco de datos bastante grande en R con dos columnas. Estoy tratando de hacer deCode columna (factor escriba con 858 niveles) las variables ficticias. El problema es que R Studio siempre se bloquea cuando intento hacer eso. > str(d) ...

2 la respuesta

¿Cómo (y por qué) utiliza contrastes?

¿En qué casos crea contrastes en su análisis? ¿Cómo se hace y para qué se utiliza? Lo comprobé?contrasts y?C - ambos conducen al "Capítulo 2 de Modelos estadísticos en S", que no está disponible para mí.

4 la respuesta

¿Cómo transformar una variable categórica en Spark en un conjunto de columnas codificadas como {0,1}?

Estoy tratando de realizar una regresión logística (LogisticRegressionWithLBFGS) con Spark MLlib (con Scala) en un conjunto de datos que contiene variables categóricas. Descubrí que Spark no pudo trabajar con ese tipo de variable. En R hay una ...

2 la respuesta

Cambiar el nombre de las categorías menos frecuentes por "OTRO" python

En mi marco de datos tengo algunas columnas categóricas con más de 100 categorías diferentes. Quiero clasificar las categorías por las más frecuentes. Mantengo las primeras 9 categorías más frecuentes y las categorías menos frecuentes las ...

5 la respuesta

Hacer histograma de frecuencia para variables de factor

Soy muy nuevo en R, así que me disculpo por una pregunta tan básica. Pasé una hora buscando en Google este problema, pero no pude encontrar una solución. Digamos que tengo algunos datos categóricos en mi conjunto de datos sobre tipos de mascotas ...

6 la respuesta

¿Alguna forma de obtener asignaciones de un codificador de etiquetas en pandas Python?

Estoy convirtiendo cadenas en valores categóricos en mi conjunto de datos utilizando el siguiente fragmento de código. data['weekday'] = pd.Categorical.from_array(data.weekday).labelsPor ejemplo, index weekday 0 Sunday 1 Sunday 2 Wednesday 3 ...

1 la respuesta

Matplotlib: ¿como trazar datos categóricos en el eje y?

Digamos que tengo el siguiente código, que proviene deaquí [https://stackoverflow.com/questions/29508208/best-way-to-plot-categorical-data?answertab=active#tab-top] : gender = ['male','male','female','male','female'] import matplotlib.pyplot ...

1 la respuesta

Factoriza una columna de cadenas en pandas

Como dice la pregunta, tengo un marco de datosdf_original que es bastante grande pero se ve así: ID Count Column 2 Column 3 Column 4 RowX 1 234. 255. yes. 452 RowY 1 123. 135. no. 342 RowW 1 234. 235. yes. 645 RowJ 1 123. 115. no. 342 RowA 1 ...