Resultados de la búsqueda a petición "data-cleaning"
¿Cómo limpio los datos de Twitter en R?
Extraje tweets de Twitter usando el paquete twitteR y los guardé en un archivo de texto. He realizado lo siguiente en el corpus xx<-tm_map(xx,removeNumbers, lazy=TRUE, 'mc.cores=1') xx<-tm_map(xx,stripWhitespace, lazy=TRUE, ...
tuberías dplyr: cómo cambiar el marco de datos original
Cuando no uso una tubería, puedo cambiar el daframe original usando este comando df<-slice(df,-c(1:3))%>% # delete top 3 rows df<-select(df,-c(Col1,Col50,Col51)) # delete specific columns¿Cómo se haría esto con una pipa? Intenté esto ...
Bucle grepl () a través de data.table (R)
Tengo un conjunto de datos almacenado como data.tableDT que se parece a esto: print(DT) category industry 1: administration admin 2: nurse practitioner truck 3: trucking truck 4: administration admin 5: warehousing nurse 6: warehousing admin 7: ...
Cómo grabar líneas malas omitidas por pandas
Estoy leyendo un archivo CSV con pandas con error_bad_lines=FalseSe imprime una advertencia cuando se encuentra una línea incorrecta. Sin embargo, quiero mantener un registro de todos los números de línea incorrecta para alimentar a otro ...
Los pandas de Python se agrupan en varias columnas, luego pivotan
En Python, tengo un DataFrame de pandas similar al siguiente: Item | shop1 | shop2 | shop3 | Category ------------------------------------ Shoes| 45 | 50 | 53 | Clothes TV | 200 | 300 | 250 | Technology Book | 20 | 17 | 21 | Books phone| 300 | ...
¿Cómo puedo convertir parte de los datos de Excel en columnas para obtener el resultado deseado?
Por ejemplo, supongamos que tengo datos en el siguiente formato: Formato actual [/imgs/JB249.png] Necesitaría que los datos se formateen en el siguiente formato para facilitar su uso: Formato requerido [/imgs/bf8L0.png] Por supuesto, los ...
Vuelva 2010 Q1 a fecha y hora como 2010-3-31
[/imgs/9c8AF.png] ¿Cómo encontrar una solución inteligente para convertir Year_Q en datetime? Traté de usar pd.to_datetime(working_visa_nationality['Year_Q']) but got error dice que esto no se puede reconocer. Así que intenté de una manera ...