Resultados de la búsqueda a petición "categorical-data"

1 la respuesta

Revelar características del clúster k-modes

Estoy realizando un análisis de clúster en datos categóricos, por lo tanto, uso el enfoque de modos k. Mis datos tienen la forma de una encuesta de preferencias: ¿Qué le parece el cabello y los ojos? [/imgs/6T7QR.png] El encuestado puede ...

6 la respuesta

¿Alguna forma de obtener asignaciones de un codificador de etiquetas en pandas Python?

Estoy convirtiendo cadenas en valores categóricos en mi conjunto de datos utilizando el siguiente fragmento de código. data['weekday'] = pd.Categorical.from_array(data.weekday).labelsPor ejemplo, index weekday 0 Sunday 1 Sunday 2 Wednesday 3 ...

1 la respuesta

¿Cómo maneja Tensorflow las funciones categóricas con múltiples entradas dentro de una columna?

Por ejemplo, tengo datos en lo siguientecsv formato: csv col0 col1 col2 col3 1 A E|A|C 3 0 B D|F 2 2 C | 2Cada columna separada por comas representa una característica. Normalmente, una característica es única (p. Ej.col0, col1, col3), pero en ...

1 la respuesta

pd.get_dummies () ralentiza en niveles grandes

No estoy seguro de si este es el método más rápido posible, o si lo estoy haciendo de manera ineficiente. Quiero codificar en caliente una columna categórica particular que tiene 27k + niveles posibles. La columna tiene valores diferentes en 2 ...

0 la respuesta

Búsqueda de incrustación de Tensorflow con listas de tamaños desiguales

Hej chicos, estoy tratando de proyectar datos categóricos multi etiquetados en un espacio denso usando incrustaciones. Aquí hay un ejemplo de juguete. Digamos que tengo cuatro categorías y quiero proyectarlas en un espacio 2D. Además, obtuve dos ...

1 la respuesta

Factoriza una columna de cadenas en pandas

Como dice la pregunta, tengo un marco de datosdf_original que es bastante grande pero se ve así: ID Count Column 2 Column 3 Column 4 RowX 1 234. 255. yes. 452 RowY 1 123. 135. no. 342 RowW 1 234. 235. yes. 645 RowJ 1 123. 115. no. 342 RowA 1 ...

3 la respuesta

¿Hay alguna ventaja en ordenar una variable categórica?

Me han informado que es mejor ordenar variables categóricas cuando sea apropiado (por ejemplo, corto menos que medio menos que largo). Me pregunto, ¿cuál es la ventaja específica de tratar una variable categórica como ordenada en lugar ...

5 la respuesta

Hacer histograma de frecuencia para variables de factor

Soy muy nuevo en R, así que me disculpo por una pregunta tan básica. Pasé una hora buscando en Google este problema, pero no pude encontrar una solución. Digamos que tengo algunos datos categóricos en mi conjunto de datos sobre tipos de mascotas ...

1 la respuesta

R: expandir un factor R en columnas ficticias para cada nivel de factor

Tengo un marco de datos bastante grande en R con dos columnas. Estoy tratando de hacer deCode columna (factor escriba con 858 niveles) las variables ficticias. El problema es que R Studio siempre se bloquea cuando intento hacer eso. > str(d) ...

1 la respuesta

Errores de entrenamiento de cuidado de R cuando y no es un factor

Estoy usando R-studio y estoy usando kaggle'sdatos de cobertura forestal [http://www.kaggle.com/c/forest-cover-type-prediction/data]y sigue obteniendo un error al intentar usar la función knn3 en caret. Aquí está mi código: library(caret) train ...