Resultados de la búsqueda a petición "pandas"

2 la respuesta

Recuento de valor único en pandas de columna [duplicado]

Esta pregunta ya tiene una respuesta aquí: Tabla de frecuencia para una sola variable [/questions/12207326/frequency-table-for-a-single-variable] 3 respuestasTengo un marco de datos y estoy mirando una columna dentro del marco de datos ...

4 la respuesta

La forma más eficiente de reenviar valores de NaN en una matriz numpy

Problema de ejemploComo un ejemplo simple, considere la matriz numpyarr Como es definido debajo: import numpy as np arr = np.array([[5, np.nan, np.nan, 7, 2], [3, np.nan, 1, 8, np.nan], [4, 9, 6, np.nan, np.nan]])dóndearr se ve así en la salida ...

1 la respuesta

diccionario de Python para el marco de datos de pandas con múltiples columnas

Tengo el siguiente diccionario de Python: d= {'data' : Counter({ 'important' : 2, 'very' : 3}), 'analytics' : Counter({ 'boring' : 5, 'sleep' : 3}) }Quiero guardarlo como un marco de datos de pandas en el siguiente formato: category | word | ...

1 la respuesta

cómo convertir datos mensuales a trimestrales en pandas

Tengo datos mensuales Quiero convertirlo a "períodos" de 3 meses donde q1 comienza en enero. Entonces, en el siguiente ejemplo, la agregación de los primeros 3 meses se traduciría en el inicio de q2 (formato deseado: 1996q2). Y el valor de los ...

1 la respuesta

Python: división de marcos de datos en múltiples marcos de datos basados en valores de columna y nombrarlos con esos valores [duplicado]

Esta pregunta ya tiene una respuesta aquí: División de trama de datos en múltiples tramas de datos [/questions/19790790/splitting-dataframe-into-multiple-dataframes] 9 respuestas Tengo un gran conjunto de datos que enumera productos de la ...

1 la respuesta

Convertir Float a Int en ciertas columnas en un marco de datos

Estoy tratando de convertir las columnas 0 a 4 y 6 a ints desde allí los tipos flotantes actuales. Lo intenté: df[0:4,6].astype(int)pero por supuesto esto no funciona ...

4 la respuesta

¿Cómo derretir Spark DataFrame?

¿Hay un equivalente de la función Pandas Melt en Apache Spark en PySpark o al menos en Scala? Estaba ejecutando un conjunto de datos de muestra hasta ahora en python y ahora quiero usar Spark para todo el conjunto de datos. Gracias por adelantado.

4 la respuesta

Python Pandas: soltar filas de una serie de tiempo según el rango de tiempo

Tengo la siguiente serie de tiempo: start = pd.to_datetime('2016-1-1') end = pd.to_datetime('2016-1-15') rng = pd.date_range(start, end, freq='2h') df = pd.DataFrame({'timestamp': rng, 'values': np.random.randint(0,100,len(rng))}) df = ...

1 la respuesta

Formato de fecha de índice de marco de datos de pandas

Tengo un marco de datos que obtuve del siguiente código, pero no puedo convertir eldate índice a dd / mm / aaaa df= pandas.read_html(base_url, header=0, index_col='Date', parse_dates=True)[0] df.index = pandas.to_datetime(df.index, ...

2 la respuesta

Muestras estratificadas de pandas

Tengo un DataFrame de pandas que se ve aproximadamente de la siguiente manera: cli_id | X1 | X2 | X3 | ... | Xn | Y | ---------------------------------------- 123 | 1 | A | XX | ... | 4 | 0.1 | 456 | 2 | B | XY | ... | 5 | 0.2 | 789 | 1 | B | XY ...