Resultados de la búsqueda a petición "pandas"

2 la respuesta

Crear valor hash para cada fila de datos con columnas seleccionadas en el marco de datos en pandas python

he preguntadopregunta similar [https://stackoverflow.com/questions/5086794/create-hash-value-for-each-row-of-data-in-dataframe-in-r] en R sobre la creación de valor hash para cada fila de datos. Sé que puedo usar algo comohashlib.md5(b'Hello ...

2 la respuesta

DataFrame.drop_duplicates y DataFrame.drop no eliminan filas

He leído en un csv en un marco de datos de pandas y tiene cinco columnas. Ciertas filas tienen valores duplicados solo en la segunda columna, quiero eliminar estas filas del marco de datos, pero ni drop ni drop_duplicates están funcionando. Aquí ...

1 la respuesta

Pandas: por que pandas.Series.std () es diferente de numpy.std ()

Otra actualización: resuelta (ver comentarios y mi propia respuesta). Actualización: esto es lo que estoy tratando de explicar. >>> pd.Series([7,20,22,22]).std() 7.2284161474004804 >>> np.std([7,20,22,22]) 6.2599920127744575Respuesta: esto se ...

1 la respuesta

Cómo usar mapas de color para colorear parcelas de Pandas DataFrames

tengo unpd.DataFrame como éste: ColumnName 1 1 2 3 1 2 3 1 2 2Puedo trazarlo condf['ColumnName'].plot(style='o') Cómo puedo definir diferentes colores para los diferentes valores en la columna (por ejemplo, rojo para el valor 1, verde para 2, ...

4 la respuesta

Cómo iterar sobre fragmentos consecutivos del marco de datos de Pandas de manera eficiente

Tengo un gran marco de datos (varios millones de filas). Quiero poder hacer una operación groupby en él, pero solo agrupando por subconjuntos arbitrarios consecutivos (preferiblemente de igual tamaño) de filas, en lugar de usar cualquier ...

6 la respuesta

Pandas: sumar filas de DataFrame para columnas dadas

Tengo el siguiente DataFrame: In [1]: import pandas as pd df = pd.DataFrame({'a': [1,2,3], 'b': [2,3,4], 'c':['dd','ee','ff'], 'd':[5,9,1]}) df Out [1]: a b c d 0 1 2 dd 5 1 2 3 ee 9 2 3 4 ff 1Me gustaría agregar una columna'e' cual es la suma ...

4 la respuesta

¿Cómo puedo dejar justificar el texto en una columna Pandas DataFrame en un cuaderno de IPython?

Estoy tratando de formatear la salida en un cuaderno de IPython. Intenté usar la función to_string, y esto me permite eliminar claramente la columna de índice. Pero los datos textuales están justificados correctamente. En [10]: import pandas as ...

1 la respuesta

Trazar series de tiempo con Seaborn FacetGrid

Tengo un DataFrame (data) con un índice entero simple y 5 columnas. Las columnas sonDate, Country, AgeGroup, Gender, Stat. (Se cambiaron los nombres para proteger a los inocentes). Me gustaría producir unFacetGrid donde elCountry define la ...

1 la respuesta

Fórmula de Haversine vectorizada con un marco de datos de pandas

Sé que para encontrar la distancia entre dos puntos de latitud y longitud necesito usar la función haversine: def haversine(lon1, lat1, lon2, lat2): lon1, lat1, lon2, lat2 = map(radians, [lon1, lat1, lon2, lat2]) dlon = lon2 - lon1 dlat = lat2 - ...

1 la respuesta

El marco de datos de Pandas se fusionó sin reindexar

Preguntándose si hay una forma más intuitiva de fusionar marcos de datos In[140]: df1 = pd.DataFrame(data=[[1,2],[3,4],[10,4],[5,6]], columns=['A','B'], index=[1,3,5,7]) In[141]: df1 Out[141]: A B 1 1 2 3 3 4 5 10 4 7 5 6 In[142]: df2 = ...