Resultados de la búsqueda a petición "dataframe"

6 la respuesta

insertar filas entre fechas por grupo

Quiero insertar filas entre dos fechas por grupo. Mi manera de hacerlo es tan complicada que inserto valores perdidos en la última observación y luego combino. Me preguntaba si hay alguna manera más fácil de lograrlo. # sample data ...

1 la respuesta

Scala / Spark dataframes: encuentre el nombre de columna correspondiente al máximo

En Scala / Spark, tener un marco de datos: val dfIn = sqlContext.createDataFrame(Seq( ("r0", 0, 2, 3), ("r1", 1, 0, 0), ("r2", 0, 2, 2))).toDF("id", "c0", "c1", "c2")Me gustaría calcular una nueva columnamaxCol sosteniendo elnombrede la columna ...

2 la respuesta

Insertar nuevas filas en el marco de datos de pandas en índices específicos

Tengo un siguiente marco de datosdfcon dos columnas "identificador", "valores" y "subid": identifier values subid 0 1 101 1 1 1 102 1 2 1 103 2 #index in list x 3 1 104 2 4 1 105 2 5 2 106 3 6 2 107 3 7 2 108 3 8 2 109 4 #index in list x 9 2 110 ...

1 la respuesta

¿Cómo desenrollar una matriz en DataFrame (de JSON)?

Cada registro en un RDD contiene un json. Estoy usando SQLContext para crear un DataFrame de Json como este: val signalsJsonRdd = sqlContext.jsonRDD(signalsJson)A continuación se muestra el esquema. datapayload es una matriz de elementos. Quiero ...

3 la respuesta

Seleccione columnas usando pandas dataframe.query ()

La documentación sobredataframe.query() esmuy breve http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.query.html [http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.query.html] . Tampoco pude encontrar ...

3 la respuesta

Comparación booleana de pandas en el marco de datos

Recibo el error cuando hago una comparación en un solo elemento en un marco de datos, pero no entiendo por qué. Tengo un marco de datos df con datos de series de tiempo para varios clientes, con algunos valores nulos: df.head() 8143511 8145987 ...

3 la respuesta

PySpark, superior para DataFrame

Lo que quiero hacer es un marco de datos, tomar los n elementos principales de acuerdo con alguna columna especificada. La parte superior (self, num) en RDD API es exactamente lo que quiero. Me pregunto si hay una API equivalente en el mundo ...

1 la respuesta

Crear / acceder a un marco de datos dentro de la transformación de otro marco de datos

Estoy adaptando un código existente para usar Spark. Tengo múltiples marcos de datos que contienen diferentes conjuntos de datos. Al transformar mi marco de datos principal (o mi conjunto de datos principal), necesito usar datos de los otros ...

4 la respuesta

Derritiendo un marco de datos de pandas

Tengo un marco de datos como este NSW VIC 0 6718023 5023203 1 6735528 5048207 2 6742690 5061266 3 6766133 5083593 4 6786160 5103965Quiero cambiarlo asi 0 6718023 NSW 1 6735528 NSW 2 6742690 NSW 3 6766133 NSW 4 6786160 NSW 5 5023203 VIC 6 ...

2 la respuesta

cómo hacer coincidir una palabra en una columna de datos con una lista de valores y aplicar ignorecase en pandas en python

Tengo un df Name Ram is one of the key ram Kumar is playing cricket Ravi is playing and ravi is a good playery una lista my_list=["Ram","ravi"]y mi marco de datos deseado es, desired_df, Name Match Count Ram is one of the key ram Ram 1 Kumar ...