Resultados de la búsqueda a petición "dataframe"
Combinando múltiples columnas en un DataFrame [duplicado]
Esta pregunta ya tiene una respuesta aquí: Agrupando un marco de datos por columnas X [/questions/34304482/grouping-a-dataframe-by-x-columns] 1 respuestaTengo un DataFrame con 40 columnas (columnas 0 a 39) y quiero agruparlas de cuatro ...
AssertionError: brechas en blk ref_locs cuando unstack () dataframe
Estoy tratando de desapilar () datos en un marco de datos de Pandas, pero sigo recibiendo este error, y no estoy seguro de por qué. Aquí está mi código hasta ahora con una muestra de mis datos. Mi intento de solucionarlo fue eliminar todas las ...
pandas: registros con listas para separar filas
Tengo un Python Pandas DataFrame como este (esquema UCSC para NCBI RefSeq): chrom exonStart exonEnds name chr1 100,200,300 110,210,310 gen1 chr1 500,700 600,800 gen2 chr2 50,60,70,80 55,65,75,85 gen3y me gustaría emparejar valores de exonStarts ...
¿Cómo usar las funciones de ventana en PySpark usando DataFrames?
Intentando descubrir cómo usar las funciones de ventana en PySpark. Aquí hay un ejemplo de lo que me gustaría poder hacer, simplemente cuente la cantidad de veces que un usuario tiene un "evento" (en este caso, "dt" es una marca de tiempo ...
¿Cómo agregar una columna constante en un Spark DataFrame?
Quiero agregar una columna en unDataFrame con algún valor arbitrario (que es lo mismo para cada fila). Me sale un error cuando usowithColumn como sigue: dt.withColumn('new_column', ...
Use data.table para contar y agregar / resumir una columna
Quiero contar y agregar (sumar) una columna en undata.table, y no pude encontrar la forma más eficiente de hacer esto. Esto parece estar cerca de lo que quieroR que resume varias columnas con ...
Data.frames en R: ¿autocompletar nombre?
Lo siento si esto es trivial. Estoy viendo el siguiente comportamiento en R: > myDF <- data.frame(Score=5, scoreScaled=1) > myDF$score ## forgot that the Score variable was capitalized [1] 1Resultado esperado: devuelve NULL (aún mejor: error de ...
Pandas dataframe - suma acumulada con reinicio
Quiero calcular la suma acumulada en una columna dada (sin usar bucles, por supuesto). La advertencia es que tengo esta otra columna que especifica cuándo restablecer la suma acumulada al valor presente en esa fila. Mejor explicado por el ...
Cómo comprimir dos (o más) DataFrame en Spark
tengo dosDataFrame a yb. a es como Column 1 | Column 2 abc | 123 cde | 23b es como Column 1 1 2Quiero zipa yb (o incluso más) DataFrames que se convierte en algo así como: Column 1 | Column 2 | Column 3 abc | 123 | 1 cde | 23 | 2¿Cómo puedo ...
Ordenar el marco de datos por dos columnas (con condición) [duplicado]
Esta pregunta ya tiene una respuesta aquí: ¿Cómo ordenar un marco de datos por varias columnas? [/questions/1296646/how-to-sort-a-dataframe-by-multiple-columns] 18 respuestas Tengo el siguiente marco de datos en R: DataTable <- data.frame( Name ...