Resultados de la búsqueda a petición "pandas"

1 la respuesta

Python Pandas: Obtener fila por valor medio

Estoy tratando de obtener la fila del valor medio para una columna. Estoy usando data.median () para obtener el valor medio de 'columna'. id 30444.5 someProperty 3.0 numberOfItems 0.0 column 70.0Y data.median () ['column'] es ...

2 la respuesta

pandas: ordenar cada columna individualmente

Mi dataframe se ve así, solo que mucho más grande. d = {'Col_1' : pd.Series(['A', 'B']), 'Col_2' : pd.Series(['B', 'A', 'C']), 'Col_3' : pd.Series(['B', 'A']), 'Col_4' : pd.Series(['C', 'A', 'B', 'D']), 'Col_5' : pd.Series(['A', 'C']),} df = ...

1 la respuesta

¿Por qué los pandas aplican lambda más lento que el bucle aquí?

Tengo un marco de datos de pandas que me gustaría filtrar en función de si se cumplen ciertas condiciones. Corrí un bucle y un.apply() y usado%%timeitpara probar la velocidad. El conjunto de datos tiene alrededor de 45000 filas. El fragmento de ...

4 la respuesta

Python Pandas: cree una nueva columna para cada valor diferente de una columna fuente (con salida booleana como valores de columna)

Estoy tratando de dividir una columna de origen de un marco de datos en varias columnas en función de su contenido, y luego llenar estas columnas recién generadas con un booleano 1 o 0 de la siguiente manera: Marco de datos original: ID ...

3 la respuesta

Python Pandas: encuentra la diferencia entre dos marcos de datos

Tengo dos marcos de datos df1 y df2, donde df2 es un subconjunto de df1. ¿Cómo obtengo un nuevo marco de datos (df3), que es la diferencia entre los dos marcos de datos? En otras palabras, ¿un marco de datos que tiene todas las filas / columnas ...

2 la respuesta

Sección transversal avanzada con índice múltiple en pandas

Tengo el siguiente marco de datos: lb = [('A','a',1), ('A','a',2), ('A','a',3), ('A','b',1), ('A','b',2), ('A','b',3), ('B','a',1), ('B','a',2), ('B','a',3), ('B', 'b',1), ('B','b',2) ,('B','b',3)] col = ...

4 la respuesta

Marco de datos de pandas con columna de índice múltiple: fusionar niveles

Tengo un marco de datos,grouped, con columnas de múltiples índices de la siguiente manera: import pandas as pd codes = ["one","two","three"]; colours = ["black", "white"]; textures = ["soft", "hard"]; N= 100 # length of the dataframe df ...

1 la respuesta

Suprime la salida descriptiva al imprimir el marco de datos de pandas

Digamos que tengo un marco de datos,c: a=np.random.random((6,2)) c=pd.DataFrame(a) c.columns=['A','B']imprimir valores de la fila 0: print c.loc[(0),:]resultados en: A 0.220170 B 0.261467 Name: 0, dtype: float64Me gustaría suprimir elName: ...

5 la respuesta

Pandas read_csv low_memory y dtype opciones

Cuando llame df = pd.read_csv('somefile.csv')Yo obtengo: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/parsers.py:1130: DtypeWarning: Las columnas (4,5,7,16) tienen tipos mixtos. Especifique la opción dtype al importar o ...

2 la respuesta

Pandas: cálculos condicionales específicos de grupo

Digamos que tengo una tabla con una clave (por ejemplo, ID de cliente) y dos columnas numéricas C1 y C2. Me gustaría agrupar filas por la clave (cliente) y ejecutar algunos agregadores como sum y mean en sus columnas. Después de calcular los ...