Resultados de la búsqueda a petición "pandas"
Recuento de valor único en pandas de columna [duplicado]
Esta pregunta ya tiene una respuesta aquí: Tabla de frecuencia para una sola variable [/questions/12207326/frequency-table-for-a-single-variable] 3 respuestasTengo un marco de datos y estoy mirando una columna dentro del marco de datos ...
La forma más eficiente de reenviar valores de NaN en una matriz numpy
Problema de ejemploComo un ejemplo simple, considere la matriz numpyarr Como es definido debajo: import numpy as np arr = np.array([[5, np.nan, np.nan, 7, 2], [3, np.nan, 1, 8, np.nan], [4, 9, 6, np.nan, np.nan]])dóndearr se ve así en la salida ...
diccionario de Python para el marco de datos de pandas con múltiples columnas
Tengo el siguiente diccionario de Python: d= {'data' : Counter({ 'important' : 2, 'very' : 3}), 'analytics' : Counter({ 'boring' : 5, 'sleep' : 3}) }Quiero guardarlo como un marco de datos de pandas en el siguiente formato: category | word | ...
cómo convertir datos mensuales a trimestrales en pandas
Tengo datos mensuales Quiero convertirlo a "períodos" de 3 meses donde q1 comienza en enero. Entonces, en el siguiente ejemplo, la agregación de los primeros 3 meses se traduciría en el inicio de q2 (formato deseado: 1996q2). Y el valor de los ...
Python: división de marcos de datos en múltiples marcos de datos basados en valores de columna y nombrarlos con esos valores [duplicado]
Esta pregunta ya tiene una respuesta aquí: División de trama de datos en múltiples tramas de datos [/questions/19790790/splitting-dataframe-into-multiple-dataframes] 9 respuestas Tengo un gran conjunto de datos que enumera productos de la ...
Convertir Float a Int en ciertas columnas en un marco de datos
Estoy tratando de convertir las columnas 0 a 4 y 6 a ints desde allí los tipos flotantes actuales. Lo intenté: df[0:4,6].astype(int)pero por supuesto esto no funciona ...
¿Cómo derretir Spark DataFrame?
¿Hay un equivalente de la función Pandas Melt en Apache Spark en PySpark o al menos en Scala? Estaba ejecutando un conjunto de datos de muestra hasta ahora en python y ahora quiero usar Spark para todo el conjunto de datos. Gracias por adelantado.
Python Pandas: soltar filas de una serie de tiempo según el rango de tiempo
Tengo la siguiente serie de tiempo: start = pd.to_datetime('2016-1-1') end = pd.to_datetime('2016-1-15') rng = pd.date_range(start, end, freq='2h') df = pd.DataFrame({'timestamp': rng, 'values': np.random.randint(0,100,len(rng))}) df = ...
Formato de fecha de índice de marco de datos de pandas
Tengo un marco de datos que obtuve del siguiente código, pero no puedo convertir eldate índice a dd / mm / aaaa df= pandas.read_html(base_url, header=0, index_col='Date', parse_dates=True)[0] df.index = pandas.to_datetime(df.index, ...
Muestras estratificadas de pandas
Tengo un DataFrame de pandas que se ve aproximadamente de la siguiente manera: cli_id | X1 | X2 | X3 | ... | Xn | Y | ---------------------------------------- 123 | 1 | A | XX | ... | 4 | 0.1 | 456 | 2 | B | XY | ... | 5 | 0.2 | 789 | 1 | B | XY ...