Resultados de la búsqueda a petición "dataframe"
¿Cómo aplicar una función a una columna de un Spark DataFrame?
Supongamos que tenemos un Spark DataFrame df.getClass Class[_ <: org.apache.spark.sql.DataFrame] = class org.apache.spark.sql.DataFramecon el siguiente esquema df.printSchema root |-- rawFV: string (nullable = true) |-- tk: array (nullable = ...
Ver si existe un valor en un DataFrame
En Python para verificar si un valor está en una lista, simplemente puede hacer lo siguiente: >>>9 in [1,2,3,6,9] TrueMe gustaría hacer lo mismo para un Pandas DataFrame, pero desafortunadamente Pandas no reconoce esa notación: >>>import pandas ...
Spark Dataframes UPSERT a la tabla Postgres
Estoy usando Apache Spark DataFrames para unir dos fuentes de datos y obtener el resultado como otro DataFrame. Quiero escribir el resultado en otra tabla de Postgres. Veo esta opción: myDataFrame.write.jdbc(url, table, ...
Pandas: elimine el grupo de los datos cuando un valor en el grupo cumpla una condición requerida
Tengo agrupaciones de valores en los datos y dentro de cada grupo, me gustaría verificar si un valor dentro del grupo está debajo8. Si se cumple esta condición, se elimina todo el grupo del conjunto de datos. Tenga en cuenta que el valor al que ...
Guarde todos los marcos de datos en la lista para separar archivos .csv
Tengo una lista de marcos de datos que quiero guardar en archivos .csv independientes. Actualmente tengo una nueva línea para cada marco de datos: write.csv(lst$df1, "C:/Users/.../df1") write.csv(lst$df2, "C:/Users/.../df2") ...
reemplazar cadena en el marco de datos de pandas
Tengo un marco de datos con varias columnas. Quiero mirar una columna y si alguna de las cadenas de la columna contiene @, quiero reemplazarlas con otra cadena. ¿Cómo haría para hacer esto?
La cadena del marco de datos R contiene: ¿La columna 1 contiene la columna 2?
Tengo un marco de datos con dos columnas: Surname Email 1 house [email protected] 2 wilson [email protected] crear un vector lógico que verifique siSurname está contenido enEmail. El resultado, por lo tanto, debería ser: Surname ...
Promedio en filas para un subconjunto de columnas con valores faltantes
Tengo un 'DataFrame' que tiene valores faltantes ocasionales, y se parece a esto: Monday Tuesday Wednesday ================================================ Mike 42 NaN 12 Jenna NaN NaN 15 Jon 21 4 1Me gustaría agregar un nuevocolumn a mi marco ...
Concatenar filas de pandas DataFrame con la misma identificación
Digamos que tengo un DataFrame de pandas como: A B id 0 1 1 0 1 2 1 0 2 3 2 1 3 0 2 1Digamos que quiero combinar filas con la misma identificación para que los otros elementos de las filas se junten en una lista, de modo que el marco de datos ...
en R, cómo sumar por fila que fluye en un marco de datos
Tengo df (A) (ncol = 1, nrow = 1356) col1 5 7 9 3 2 3.8 24 2.7 12 11 23 .... to 1356 row...Me gustaría la suma de la primera fila a la quinta fila, y después de la segunda fila a la séptima fila, y así sucesivamente. Además, cada valor es ...