Resultados de la búsqueda a petición "pandas"
PANDAS divide el marco de datos en varias filas de valores únicos
Tengo un DataFrame en Pandas PRICE Name PER CATEGORY STORENAME 0 9.99 MF gram Indica Store1 1 9.99 HY gram Herb Store2 2 9.99 FF gram Herb Store2Lo que quiero hacer es dividirlos en múltiples marcos de datos para tener nombres únicos, luego ...
Tiempo de caída desde datetime <[M8] en Pandas
Así que tengo una columna 'Fecha' en mi marco de datos donde las fechas tienen el formato como este 0 1998-08-26 04:00:00Si solo quiero el año mes y día, ¿cómo elimino la hora trivial?
¿Cómo actualizar el valor en las primeras N filas por grupo en un marco de datos de pandas de múltiples índices?
Estoy tratando de actualizar las primeras N filas en un marco de datos de múltiples índices, pero estaba teniendo problemas para encontrar una solución, así que pensé en crear una publicación para ello. El código de ejemplo es el siguiente: # ...
COUNTIF en pandas python sobre múltiples columnas con múltiples condiciones
Tengo un conjunto de datos en el que intento determinar el número de factores de riesgo por persona. Entonces tengo los siguientes datos: Person_ID Age Smoker Diabetes 001 30 Y N 002 45 N N 003 27 N Y 004 18 Y Y 005 55 Y YCada atributo (Edad, ...
Python Pandas: ¿por qué el operador `in` funciona con índices y no con los datos?
Descubrí por las malas que los pandasin operador, aplicado aSeries opera en índices y no en los datos reales: In [1]: import pandas as pd In [2]: x = pd.Series([1, 2, 3]) In [3]: x.index = [10, 20, 30] In [4]: x Out[4]: 10 1 20 2 30 3 dtype: ...
¿Cómo puedo seleccionar una columna específica de cada fila en un Pandas DataFrame?
Tengo un DataFrame en este formato: a b c 0 1 2 3 1 4 5 6 2 7 8 9 3 10 11 12 4 13 14 15y una matriz como esta, con nombres de columna: ['a', 'a', 'b', 'c', 'b']y espero extraer una matriz de datos, un valor de cada fila. La matriz de nombres de ...
Cómo verificar si existe una columna en Pandas
¿Hay alguna manera de verificar si existe una columna en un Pandas DataFrame? Supongamos que tengo el siguiente DataFrame: >>> import pandas as pd >>> from random import randint >>> df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], ...
¿Iterrows tiene problemas de rendimiento?
He notado un rendimiento muy pobre al usar iterrows de pandas. ¿Es esto algo que otros experimentan? ¿Es específico para iterrows y debe evitarse esta función para datos de cierto tamaño (estoy trabajando con 2-3 millones de filas)? Esta ...
Cambiar nombres de columnas en pandas con columnas jerárquicas
Digamos que tengo un marco de datos con un índice jerárquico: >>> df = pd.DataFrame(np.ones((2, 4))) >>> df 0 1 2 3 0 1 1 1 1 1 1 1 1 1 [2 rows x 4 columns] >>> df.columns = pd.MultiIndex.from_product([['a', 'b'], ['i', 'ii']]) >>> df a b i ii i ...
Formateo de miles de separadores para enteros en un marco de datos de pandas
Estoy tratando de usar'{:,}'.format(number) como el siguiente ejemplo para formatear un número en un marco de datos de pandas: # This works for floats and integers print '{:,}'.format(20000) # 20,000 print '{:,}'.format(20000.0) # 20,000.0El ...