Resultados de la búsqueda a petición "dataframe"

Tengo el siguiente marco de datos de pandas: import pandas as pd import numpy as np df = pd.DataFrame({ 'fc': [100,100,112,1.3,14,125], 'sample_id': ['S1','S1','S1','S2','S2','S2'], 'gene_symbol': ['a', 'b', 'c', 'a', 'b', 'c'], }) df = ...

python apache-spark pyspark apache-spark-sql

3 la respuesta

Pyspark: Reemplazar valor en una columna buscando un diccionario

Soy un novato en PySpark. Tengo una chispaDataFrame df que tiene una columna 'tipo_dispositivo'. Quiero reemplazar cada valor que está en "Tableta" o "Teléfono" a "Teléfono", y reemplazar "PC" a "Escritorio". En Python puedo hacer lo ...

python pandas

4 la respuesta

Eliminar columnas sin nombre en el marco de datos de pandas [duplicado]

Esta pregunta ya tiene una respuesta aquí: Cómo deshacerse de la columna `Innominado:` en un marco de datos de pandas [/questions/36519086/how-to-get-rid-of-unnamed-column-in-a-pandas-dataframe] 3 respuestasTengo un archivo de datos de las ...

pandas numpy python nan

3 la respuesta

Sumar filas en el marco de datos de pandas agrupados y devolver NaN

Ejemploimport pandas as pd import numpy as np d = {'l': ['left', 'right', 'left', 'right', 'left', 'right'], 'r': ['right', 'left', 'right', 'left', 'right', 'left'], 'v': [-1, 1, -1, 1, -1, np.nan]} df = pd.DataFrame(d) Problema Cuando un marco ...

python pandas split debian

1 la respuesta

¿Cómo puedo dividir una columna en 2 de la manera correcta?

Estoy borrando tablas de un sitio web y lo estoy poniendo en el archivo de Excel. Mi objetivo es dividir una columna en 2 columnas de la manera correcta. Las columnas que quiero dividir: "VUELO" Quiero este formulario: Primer ejemplo: KL744 -> ...

python apache-spark pyspark apache-spark-sql

2 la respuesta

¿Cómo calcular la diferencia de fecha en pyspark?

Tengo datos como este: df = sqlContext.createDataFrame([ ('1986/10/15', 'z', 'null'), ('1986/10/15', 'z', 'null'), ('1986/10/15', 'c', 'null'), ('1986/10/15', 'null', 'null'), ('1986/10/16', 'null', '4.0')], ('low', 'high', 'normal'))Quiero ...

python pandas datetime intervals

5 la respuesta

¿Cómo unir dos marcos de datos para los que los valores de columna están dentro de un cierto rango?

Dados dos marcos de datosdf_1 ydf_2, cómo unirlos de modo que la columna de fecha y horadf_1 está en el mediostart yend en el marco de datosdf_2: print df_1 timestamp A B 0 2016-05-14 10:54:33 0.020228 0.026572 1 2016-05-14 10:54:34 0.057780 ...

r data.table

1 la respuesta

Encontrar una secuencia monótona junto con tomar la secuencia de reinicio al alcanzar el máximo en cuenta

Tengo un data.table say dt name <- letters[1:22] score <- c(42, 82, 43, 32, 47, 48, 49, 50, 54, 59, 76, 9, 13, 88, 91, 99, 4, 6, 8, 12, 14, 15) class <- rep(c('c1', 'c2', 'c3'), c(7, 3, 12)) dt <- data.table(name, score, class)parece que: > dt ...

apache-spark apache-spark-sql spark-csv

2 la respuesta

¿Cómo forzar inferSchema para CSV a considerar enteros como fechas (con la opción "dateFormat")?

Yo uso Spark 2.2.0 Estoy leyendo un archivo csv de la siguiente manera: val dataFrame = spark.read.option("inferSchema", "true") .option("header", true) .option("dateFormat", "yyyyMMdd") .csv(pathToCSVFile)Hay una columna de fecha en este ...

1 la respuesta

Ordenar un marco de datos de acuerdo con un orden dado [duplicar]

Esta pregunta ya tiene una respuesta aquí: ¿Cómo clasifico un vector en función de los valores de otro? [/questions/1568511/how-do-i-sort-one-vector-based-on-values-of-another] 7 respuestasProbablemente una pregunta fácil. tengo undata.frame ...

Página 67 de 144

65 666768 69

Resultados de la búsqueda a petición "dataframe"

Cómo extender una columna en un marco de datos de Pandas

Pyspark: Reemplazar valor en una columna buscando un diccionario

Eliminar columnas sin nombre en el marco de datos de pandas [duplicado]

Etiquetas Populares

Sumar filas en el marco de datos de pandas agrupados y devolver NaN

¿Cómo puedo dividir una columna en 2 de la manera correcta?

¿Cómo calcular la diferencia de fecha en pyspark?

¿Cómo unir dos marcos de datos para los que los valores de columna están dentro de un cierto rango?

Encontrar una secuencia monótona junto con tomar la secuencia de reinicio al alcanzar el máximo en cuenta

¿Cómo forzar inferSchema para CSV a considerar enteros como fechas (con la opción "dateFormat")?

Ordenar un marco de datos de acuerdo con un orden dado [duplicar]

¡Eres muy activo! ¡Es genial!

Resultados de la búsqueda a petición "dataframe"

Etiquetas Populares