Resultados de la búsqueda a petición "pandas"

11 la respuesta

Versión NumPy de "Promedio móvil ponderado exponencial", equivalente a pandas.ewm (). Mean ()

¿Cómo obtengo el promedio móvil ponderado exponencial en NumPy como lo siguiente enpandas [http://pandas.pydata.org/pandas-docs/stable/computation.html#exponentially-weighted-windows] ? import pandas as pd import pandas_datareader as pdr from ...

1 la respuesta

Pandas: ¿cómo convertir una lista en una matriz agrupada por una columna?

Tengo un marco de datos de pandas donde la primera columna (CLIENTE) es el nombre del cliente y el nombre del cliente se repite una vez para cada producto que el cliente ha comprado (PRODUCTO): Customer Product Count John A 1 John B 1 John C 1 ...

2 la respuesta

Filtrar dinámicamente un marco de datos de pandas

Estoy tratando de filtrar un marco de datos de pandas usando umbrales para tres columnas import pandas as pd df = pd.DataFrame({"A" : [6, 2, 10, -5, 3], "B" : [2, 5, 3, 2, 6], "C" : [-5, 2, 1, 8, 2]}) df = df.loc[(df.A > 0) & (df.B > 2) & (df.C ...

1 la respuesta

¿Por qué funciona df.apply (tuple) pero no df.apply (list)?

Aquí hay un marco de datos: A B C 0 6 2 -5 1 2 5 2 2 10 3 1 3 -5 2 8 4 3 6 2Podría recuperar una columna que es básicamente una tupla de columnas del originaldf utilizandodf.apply: out = df.apply(tuple, 1) print(out) 0 (6, 2, -5) 1 (2, 5, 2) 2 ...

2 la respuesta

Filtrado eficiente de memoria de filas `DataFrame`

Tengo un granDataFrame objeto (1,440,000,000 filas). Opero en el límite de memoria (swap includet). Necesito extraer un subconjunto de las filas con cierto valor de un campo. Sin embargo, si me gusta eso: >>> SUBSET = DATA[DATA.field == ...

3 la respuesta

Seleccionar todos los nombres de columna donde el valor es mayor que otra columna en pandas

Estoy tratando de encontrar los nombres de columna de cada columna en un marco de datos de pandas donde el valor es mayor que el de otra columna. Por ejemplo, si tengo el siguiente marco de datos: A B C D threshold 0 1 3 3 1 2 1 2 3 6 1 5 2 9 5 ...

2 la respuesta

Máscara booleana del marco de datos de pandas en varias columnas

Tengo un marco de datos (df) que contiene varias columnas con una medida real y el número correspondiente de columnas (A, B, ...) con una incertidumbre (dA, dB, ...) para cada una de estas columnas: A B dA dB 0 -1 3 0.31 0.08 1 2 -4 0.263 0.357 ...

1 la respuesta

Python: crea un marco de datos de pandas a partir de una lista

Estoy usando el siguiente código para crear un marco de datos a partir de una lista: test_list = ['a','b','c','d'] df_test = pd.DataFrame.from_records(test_list, columns=['my_letters']) df_testEl código anterior funciona bien. Luego probé ...

3 la respuesta

Gráfico de barras con múltiples etiquetas

El siguiente código solo muestra la categoría principal ['uno', 'dos', 'tres', 'cuatro', 'cinco', 'seis'] como las etiquetas del eje x. ¿Hay alguna manera de mostrar la subcategoría ['A', 'B', 'C', 'D'] como etiquetas secundarias del eje x? ...

2 la respuesta

Pandas Dataframe: une elementos en rango según sus coordenadas geográficas (longitud y latitud)

Obtuve un marco de datos que contiene lugares con su latitud y longitud. Imagina por ejemplo ciudades. df = pd.DataFrame([{'city':"Berlin", 'lat':52.5243700, 'lng':13.4105300}, {'city':"Potsdam", 'lat':52.3988600, 'lng':13.0656600}, ...