Resultados de la búsqueda a petición "pandas"
Python Pandas: Obtener fila por valor medio
Estoy tratando de obtener la fila del valor medio para una columna. Estoy usando data.median () para obtener el valor medio de 'columna'. id 30444.5 someProperty 3.0 numberOfItems 0.0 column 70.0Y data.median () ['column'] es ...
pandas: ordenar cada columna individualmente
Mi dataframe se ve así, solo que mucho más grande. d = {'Col_1' : pd.Series(['A', 'B']), 'Col_2' : pd.Series(['B', 'A', 'C']), 'Col_3' : pd.Series(['B', 'A']), 'Col_4' : pd.Series(['C', 'A', 'B', 'D']), 'Col_5' : pd.Series(['A', 'C']),} df = ...
¿Por qué los pandas aplican lambda más lento que el bucle aquí?
Tengo un marco de datos de pandas que me gustaría filtrar en función de si se cumplen ciertas condiciones. Corrí un bucle y un.apply() y usado%%timeitpara probar la velocidad. El conjunto de datos tiene alrededor de 45000 filas. El fragmento de ...
Python Pandas: cree una nueva columna para cada valor diferente de una columna fuente (con salida booleana como valores de columna)
Estoy tratando de dividir una columna de origen de un marco de datos en varias columnas en función de su contenido, y luego llenar estas columnas recién generadas con un booleano 1 o 0 de la siguiente manera: Marco de datos original: ID ...
Python Pandas: encuentra la diferencia entre dos marcos de datos
Tengo dos marcos de datos df1 y df2, donde df2 es un subconjunto de df1. ¿Cómo obtengo un nuevo marco de datos (df3), que es la diferencia entre los dos marcos de datos? En otras palabras, ¿un marco de datos que tiene todas las filas / columnas ...
Sección transversal avanzada con índice múltiple en pandas
Tengo el siguiente marco de datos: lb = [('A','a',1), ('A','a',2), ('A','a',3), ('A','b',1), ('A','b',2), ('A','b',3), ('B','a',1), ('B','a',2), ('B','a',3), ('B', 'b',1), ('B','b',2) ,('B','b',3)] col = ...
Marco de datos de pandas con columna de índice múltiple: fusionar niveles
Tengo un marco de datos,grouped, con columnas de múltiples índices de la siguiente manera: import pandas as pd codes = ["one","two","three"]; colours = ["black", "white"]; textures = ["soft", "hard"]; N= 100 # length of the dataframe df ...
Suprime la salida descriptiva al imprimir el marco de datos de pandas
Digamos que tengo un marco de datos,c: a=np.random.random((6,2)) c=pd.DataFrame(a) c.columns=['A','B']imprimir valores de la fila 0: print c.loc[(0),:]resultados en: A 0.220170 B 0.261467 Name: 0, dtype: float64Me gustaría suprimir elName: ...
Pandas read_csv low_memory y dtype opciones
Cuando llame df = pd.read_csv('somefile.csv')Yo obtengo: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Las columnas (4,5,7,16) tienen tipos mixtos. Especifique la opción dtype al importar o ...
Pandas: cálculos condicionales específicos de grupo
Digamos que tengo una tabla con una clave (por ejemplo, ID de cliente) y dos columnas numéricas C1 y C2. Me gustaría agrupar filas por la clave (cliente) y ejecutar algunos agregadores como sum y mean en sus columnas. Después de calcular los ...