Resultados de la búsqueda a petición "dataframe"
Spark dataframe guardar en un solo archivo en la ubicación hdfs [duplicado]
Esta pregunta ya tiene una respuesta aquí: Cómo guardar datos RDD en archivos json, no en carpetas [/questions/40577546/how-to-save-rdd-data-into-json-files-not-folders] 2 respuestasTengo un marco de datos y quiero guardar en un solo archivo en ...
Escribir un marco de datos de pandas rápido a postgres
Me pregunto cuál es la forma más rápida de escribir datos de pandas DataFrame en una tabla en postges DB. 1) lo he intentadopandas.to_sql, pero por alguna razón se necesita entidad para copiar datos, 2) además he intentado lo siguiente: import ...
Eliminando espacio de las columnas del marco de datos en pandas [duplicado]
Esta pregunta ya tiene una respuesta aquí: Eliminar espacio en python de trama de datos [/questions/30763351/removing-space-in-dataframe-python] 2 respuestasEstoy tratando de eliminar espacios de un marco de datos que tengo. Los nombres de ...
Pandas DataFrame: Cómo agrupar por valores consecutivos
Tengo una columna en un DataFrame con valores: [1, 1, -1, 1, -1, -1]¿Cómo puedo agruparlos así? [1,1] [-1] [1] [-1, -1]
grupo de marcos de datos de pandas por índice de suma
Tengo un marco de datos, quiero FROM: dow yield 0 F 2 1 F 3 2 M 4 3 M 6 4 TH 7 TO: dow ysum 0 F 5 1 M 10 2 TH 7 pero tengo esto: |yield ------------- dow | ------------- F |5 M |10 TH |7Así es como lo hice: d1=['F','F','M','M','TH'] ...
Transformar de ancho a largo sin ordenar columnas
Quiero convertir un marco de datos de formato ancho a formato largo. Aquí hay un ejemplo de juguete: mydata <- data.frame(ID=1:5, ZA_1=1:5, ZA_2=5:1,BB_1=rep(3,5),BB_2=rep(6,5),CC_7=6:2) ID ZA_1 ZA_2 BB_1 BB_2 CC_7 1 1 5 3 6 6 2 2 4 3 6 5 3 3 3 ...
Spark SQL - cláusula IN
Me gustaría agregar la condición where para una columna con valores múltiples en DataFrame. Funciona por un solo valor, por ejemplo. df.where($"type".==="type1" && $"status"==="completed").¿Cómo puedo agregar múltiples valores para la misma ...
pandas ¿cómo usar groupby para agrupar columnas por fecha en la etiqueta?
Tengo un marco de datos de 10730 filas × 249 columnas, tengo columnas: Index(['RegionID', 'Metro', 'CountyName', 'SizeRank', '1996-04', '1996-05', '1996-06', '1996-07', '1996-08', '1996-09', ... '2015-11', '2015-12', '2016-01', '2016-02', ...
Cómo agregar simplemente un nivel de columna a un marco de datos de pandas
Digamos que tengo un marco de datos que se ve así: df = pd.DataFrame(index=list('abcde'), data={'A': range(5), 'B': range(5)}) df Out[92]: A B a 0 0 b 1 1 c 2 2 d 3 3 e 4 4Asumiendo que este marco de datos ya existe, ¿cómo puedo simplemente ...
R: reemplazo de NA en un marco de datos con valores en la misma posición en otro marco de datos
Tengo un marco de datos con algunos valores de NA: dfa <- data.frame(a=c(1,NA,3,4,5,NA),b=c(1,5,NA,NA,8,9),c=c(7,NA,NA,NA,2,NA)) dfaMe gustaría reemplazar los NA con valores en la misma posición en otro marco de datos: dfrepair <- ...