Resultados de la búsqueda a petición "pandas"

3 la respuesta

Datos faltantes, inserte filas en Pandas y rellene con NAN

Soy nuevo en Python y Pandas, por lo que podría haber una solución simple que no veo. Tengo una serie de conjuntos de datos discontinuos que se ven así: ind A B C 0 0.0 1 3 1 0.5 4 2 2 1.0 6 1 3 3.5 2 0 4 4.0 4 5 5 4.5 3 3Ahora busco una ...

2 la respuesta

La forma más rápida de procesar numéricamente 2d-array: dataframe vs series vs array vs numba

Editar para agregar: No creo que los puntos de referencia de numba sean justos, notas a continuación Estoy tratando de comparar diferentes enfoques para procesar datos numéricamente para el siguiente caso de uso: Conjunto de datos bastante ...

2 la respuesta

Búsqueda de pandas basada en el valor

Tengo el siguiente DataFrame: Date best a b c d 1990 a 5 4 7 2 1991 c 10 1 2 0 1992 d 2 1 4 12 1993 a 5 8 11 6 Me gustaría hacer un marco de datos de la siguiente manera: Date best value 1990 a 5 1991 c 2 1992 d 12 1993 a 5Así que estoy ...

2 la respuesta

Elimine las 'Celdas' NaN sin soltar toda la FILA (Pandas, Python3)

En este momento tengo un DF como este Word Word2 Word3 Hello NaN NaN My My Name NaN Yellow Yellow Bee Yellow Bee Hive Golden Golden Gates NaN Yellow NaN NaNLo que esperaba era eliminar todas las celdas de NaN de mi marco de datos. Entonces, al ...

2 la respuesta

¿Por qué Pandas itera sobre las columnas del Marco de datos de forma predeterminada?

Tratando de entender la lógica del diseño detrás de algunas de las características de Pandas. Si tengo un DataFrame con 3560 filas y 18 columnas, entonces len(frame)es 3560, pero len([a for a in frame])es 18. Tal vez esto se siente natural ...

2 la respuesta

Convierta pandas. Serie de objeto dtype a flotante, y errores a nans

Considere la siguiente situación: In [2]: a = pd.Series([1,2,3,4,'.']) In [3]: a Out[3]: 0 1 1 2 2 3 3 4 4 . dtype: object In [8]: a.astype('float64', raise_on_error = False) Out[8]: 0 1 1 2 2 3 3 4 4 . dtype: objectHubiera esperado una opción ...

1 la respuesta

Nombre de columna del segundo valor más grande de Pandas

Estoy tratando de encontrar el nombre de columna asociado con los valores más grandes y segundos en un DataFrame, aquí hay un ejemplo simplificado (el real tiene más de 500 columnas): Date val1 val2 val3 val4 1990 5 7 1 10 1991 2 1 10 3 1992 10 ...

7 la respuesta

ImportError HDFStore requiere PyTables No hay módulos con nombre en tablas

import pandas as pd dfs = pd.HDFStore('xxxxx.h5')arroja este error: "ImportError: HDFStore requires PyTables, "No module named tables" problem importing" Intenté instalar PyTables, que requiere Cython. Tengo instalado Cython 0.21, pero arroja ...

2 la respuesta

Scikit Learn OneHotEncoder ajusta y transforma Error: ValueError: X tiene una forma diferente que durante el ajuste

Abajo está mi código. Sé por qué se produce el error durante la transformación. Esto se debe a que la lista de características no coincide durante el ajuste y la transformación. Como puedo resolver esto? ¿Cómo puedo obtener 0 para todas las ...

3 la respuesta

hacer pandas DataFrame a un dict y dropna

Tengo algunos pandas DataFrame con NaNs en él. Me gusta esto: import pandas as pd import numpy as np raw_data={'A':{1:2,2:3,3:4},'B':{1:np.nan,2:44,3:np.nan}} data=pd.DataFrame(raw_data) >>> data A B 1 2 NaN 2 3 44 3 4 NaNAhora quiero hacer un ...