Resultados de la búsqueda a petición "data-cleaning"
tuberías dplyr: cómo cambiar el marco de datos original
Cuando no uso una tubería, puedo cambiar el daframe original usando este comando df<-slice(df,-c(1:3))%>% # delete top 3 rows df<-select(df,-c(Col1,Col50,Col51)) # delete specific columns¿Cómo se haría esto con una pipa? Intenté esto ...
Bucle grepl () a través de data.table (R)
Tengo un conjunto de datos almacenado como data.tableDT que se parece a esto: print(DT) category industry 1: administration admin 2: nurse practitioner truck 3: trucking truck 4: administration admin 5: warehousing nurse 6: warehousing admin 7: ...
Cómo grabar líneas malas omitidas por pandas
Estoy leyendo un archivo CSV con pandas con error_bad_lines=FalseSe imprime una advertencia cuando se encuentra una línea incorrecta. Sin embargo, quiero mantener un registro de todos los números de línea incorrecta para alimentar a otro ...
¿Cómo limpio los datos de Twitter en R?
Extraje tweets de Twitter usando el paquete twitteR y los guardé en un archivo de texto. He realizado lo siguiente en el corpus xx<-tm_map(xx,removeNumbers, lazy=TRUE, 'mc.cores=1') xx<-tm_map(xx,stripWhitespace, lazy=TRUE, ...
¿Cómo puedo convertir parte de los datos de Excel en columnas para obtener el resultado deseado?
Por ejemplo, supongamos que tengo datos en el siguiente formato: Formato actual [/imgs/JB249.png] Necesitaría que los datos se formateen en el siguiente formato para facilitar su uso: Formato requerido [/imgs/bf8L0.png] Por supuesto, los ...
Vuelva 2010 Q1 a fecha y hora como 2010-3-31
[/imgs/9c8AF.png] ¿Cómo encontrar una solución inteligente para convertir Year_Q en datetime? Traté de usar pd.to_datetime(working_visa_nationality['Year_Q']) but got error dice que esto no se puede reconocer. Así que intenté de una manera ...
Los pandas de Python se agrupan en varias columnas, luego pivotan
En Python, tengo un DataFrame de pandas similar al siguiente: Item | shop1 | shop2 | shop3 | Category ------------------------------------ Shoes| 45 | 50 | 53 | Clothes TV | 200 | 300 | 250 | Technology Book | 20 | 17 | 21 | Books phone| 300 | ...