Resultados de la búsqueda a petición "data-cleaning"

1 la respuesta

tuberías dplyr: cómo cambiar el marco de datos original

Cuando no uso una tubería, puedo cambiar el daframe original usando este comando df<-slice(df,-c(1:3))%>% # delete top 3 rows df<-select(df,-c(Col1,Col50,Col51)) # delete specific columns¿Cómo se haría esto con una pipa? Intenté esto ...

3 la respuesta

Bucle grepl () a través de data.table (R)

Tengo un conjunto de datos almacenado como data.tableDT que se parece a esto: print(DT) category industry 1: administration admin 2: nurse practitioner truck 3: trucking truck 4: administration admin 5: warehousing nurse 6: warehousing admin 7: ...

1 la respuesta

Cómo grabar líneas malas omitidas por pandas

Estoy leyendo un archivo CSV con pandas con error_bad_lines=FalseSe imprime una advertencia cuando se encuentra una línea incorrecta. Sin embargo, quiero mantener un registro de todos los números de línea incorrecta para alimentar a otro ...

4 la respuesta

¿Cómo limpio los datos de Twitter en R?

Extraje tweets de Twitter usando el paquete twitteR y los guardé en un archivo de texto. He realizado lo siguiente en el corpus xx<-tm_map(xx,removeNumbers, lazy=TRUE, 'mc.cores=1') xx<-tm_map(xx,stripWhitespace, lazy=TRUE, ...

2 la respuesta

¿Cómo puedo convertir parte de los datos de Excel en columnas para obtener el resultado deseado?

Por ejemplo, supongamos que tengo datos en el siguiente formato: Formato actual [/imgs/JB249.png] Necesitaría que los datos se formateen en el siguiente formato para facilitar su uso: Formato requerido [/imgs/bf8L0.png] Por supuesto, los ...

3 la respuesta

Vuelva 2010 Q1 a fecha y hora como 2010-3-31

[/imgs/9c8AF.png] ¿Cómo encontrar una solución inteligente para convertir Year_Q en datetime? Traté de usar pd.to_datetime(working_visa_nationality['Year_Q']) but got error dice que esto no se puede reconocer. Así que intenté de una manera ...

3 la respuesta

Los pandas de Python se agrupan en varias columnas, luego pivotan

En Python, tengo un DataFrame de pandas similar al siguiente: Item | shop1 | shop2 | shop3 | Category ------------------------------------ Shoes| 45 | 50 | 53 | Clothes TV | 200 | 300 | 250 | Technology Book | 20 | 17 | 21 | Books phone| 300 | ...