Resultados de la búsqueda a petición "dataframe"
insertar filas entre fechas por grupo
Quiero insertar filas entre dos fechas por grupo. Mi manera de hacerlo es tan complicada que inserto valores perdidos en la última observación y luego combino. Me preguntaba si hay alguna manera más fácil de lograrlo. # sample data ...
Scala / Spark dataframes: encuentre el nombre de columna correspondiente al máximo
En Scala / Spark, tener un marco de datos: val dfIn = sqlContext.createDataFrame(Seq( ("r0", 0, 2, 3), ("r1", 1, 0, 0), ("r2", 0, 2, 2))).toDF("id", "c0", "c1", "c2")Me gustaría calcular una nueva columnamaxCol sosteniendo elnombrede la columna ...
Insertar nuevas filas en el marco de datos de pandas en índices específicos
Tengo un siguiente marco de datosdfcon dos columnas "identificador", "valores" y "subid": identifier values subid 0 1 101 1 1 1 102 1 2 1 103 2 #index in list x 3 1 104 2 4 1 105 2 5 2 106 3 6 2 107 3 7 2 108 3 8 2 109 4 #index in list x 9 2 110 ...
¿Cómo desenrollar una matriz en DataFrame (de JSON)?
Cada registro en un RDD contiene un json. Estoy usando SQLContext para crear un DataFrame de Json como este: val signalsJsonRdd = sqlContext.jsonRDD(signalsJson)A continuación se muestra el esquema. datapayload es una matriz de elementos. Quiero ...
Seleccione columnas usando pandas dataframe.query ()
La documentación sobredataframe.query() esmuy breve http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.query.html [http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.query.html] . Tampoco pude encontrar ...
Comparación booleana de pandas en el marco de datos
Recibo el error cuando hago una comparación en un solo elemento en un marco de datos, pero no entiendo por qué. Tengo un marco de datos df con datos de series de tiempo para varios clientes, con algunos valores nulos: df.head() 8143511 8145987 ...
PySpark, superior para DataFrame
Lo que quiero hacer es un marco de datos, tomar los n elementos principales de acuerdo con alguna columna especificada. La parte superior (self, num) en RDD API es exactamente lo que quiero. Me pregunto si hay una API equivalente en el mundo ...
Crear / acceder a un marco de datos dentro de la transformación de otro marco de datos
Estoy adaptando un código existente para usar Spark. Tengo múltiples marcos de datos que contienen diferentes conjuntos de datos. Al transformar mi marco de datos principal (o mi conjunto de datos principal), necesito usar datos de los otros ...
Derritiendo un marco de datos de pandas
Tengo un marco de datos como este NSW VIC 0 6718023 5023203 1 6735528 5048207 2 6742690 5061266 3 6766133 5083593 4 6786160 5103965Quiero cambiarlo asi 0 6718023 NSW 1 6735528 NSW 2 6742690 NSW 3 6766133 NSW 4 6786160 NSW 5 5023203 VIC 6 ...
cómo hacer coincidir una palabra en una columna de datos con una lista de valores y aplicar ignorecase en pandas en python
Tengo un df Name Ram is one of the key ram Kumar is playing cricket Ravi is playing and ravi is a good playery una lista my_list=["Ram","ravi"]y mi marco de datos deseado es, desired_df, Name Match Count Ram is one of the key ram Ram 1 Kumar ...