Resultados de la búsqueda a petición "dataframe"

2 la respuesta

Cómo extender una columna en un marco de datos de Pandas

Tengo el siguiente marco de datos de pandas: import pandas as pd import numpy as np df = pd.DataFrame({ 'fc': [100,100,112,1.3,14,125], 'sample_id': ['S1','S1','S1','S2','S2','S2'], 'gene_symbol': ['a', 'b', 'c', 'a', 'b', 'c'], }) df = ...

3 la respuesta

Pyspark: Reemplazar valor en una columna buscando un diccionario

Soy un novato en PySpark. Tengo una chispaDataFrame df que tiene una columna 'tipo_dispositivo'. Quiero reemplazar cada valor que está en "Tableta" o "Teléfono" a "Teléfono", y reemplazar "PC" a "Escritorio". En Python puedo hacer lo ...

4 la respuesta

Eliminar columnas sin nombre en el marco de datos de pandas [duplicado]

Esta pregunta ya tiene una respuesta aquí: Cómo deshacerse de la columna `Innominado:` en un marco de datos de pandas [/questions/36519086/how-to-get-rid-of-unnamed-column-in-a-pandas-dataframe] 3 respuestasTengo un archivo de datos de las ...

3 la respuesta

Sumar filas en el marco de datos de pandas agrupados y devolver NaN

Ejemploimport pandas as pd import numpy as np d = {'l': ['left', 'right', 'left', 'right', 'left', 'right'], 'r': ['right', 'left', 'right', 'left', 'right', 'left'], 'v': [-1, 1, -1, 1, -1, np.nan]} df = pd.DataFrame(d) Problema Cuando un marco ...

1 la respuesta

¿Cómo puedo dividir una columna en 2 de la manera correcta?

Estoy borrando tablas de un sitio web y lo estoy poniendo en el archivo de Excel. Mi objetivo es dividir una columna en 2 columnas de la manera correcta. Las columnas que quiero dividir: "VUELO" Quiero este formulario: Primer ejemplo: KL744 -> ...

2 la respuesta

¿Cómo calcular la diferencia de fecha en pyspark?

Tengo datos como este: df = sqlContext.createDataFrame([ ('1986/10/15', 'z', 'null'), ('1986/10/15', 'z', 'null'), ('1986/10/15', 'c', 'null'), ('1986/10/15', 'null', 'null'), ('1986/10/16', 'null', '4.0')], ('low', 'high', 'normal'))Quiero ...

5 la respuesta

¿Cómo unir dos marcos de datos para los que los valores de columna están dentro de un cierto rango?

Dados dos marcos de datosdf_1 ydf_2, cómo unirlos de modo que la columna de fecha y horadf_1 está en el mediostart yend en el marco de datosdf_2: print df_1 timestamp A B 0 2016-05-14 10:54:33 0.020228 0.026572 1 2016-05-14 10:54:34 0.057780 ...

1 la respuesta

Encontrar una secuencia monótona junto con tomar la secuencia de reinicio al alcanzar el máximo en cuenta

Tengo un data.table say dt name <- letters[1:22] score <- c(42, 82, 43, 32, 47, 48, 49, 50, 54, 59, 76, 9, 13, 88, 91, 99, 4, 6, 8, 12, 14, 15) class <- rep(c('c1', 'c2', 'c3'), c(7, 3, 12)) dt <- data.table(name, score, class)parece que: > dt ...

2 la respuesta

¿Cómo forzar inferSchema para CSV a considerar enteros como fechas (con la opción "dateFormat")?

Yo uso Spark 2.2.0 Estoy leyendo un archivo csv de la siguiente manera: val dataFrame = spark.read.option("inferSchema", "true") .option("header", true) .option("dateFormat", "yyyyMMdd") .csv(pathToCSVFile)Hay una columna de fecha en este ...

1 la respuesta

Ordenar un marco de datos de acuerdo con un orden dado [duplicar]

Esta pregunta ya tiene una respuesta aquí: ¿Cómo clasifico un vector en función de los valores de otro? [/questions/1568511/how-do-i-sort-one-vector-based-on-values-of-another] 7 respuestasProbablemente una pregunta fácil. tengo undata.frame ...