Resultados de la búsqueda a petición "dataframe"

2 la respuesta

Pandas: cómo designar la fila inicial para extraer datos

Estoy usando la biblioteca Pandas y Python. Tengo un archivo de Excel que tiene información de encabezado en la parte superior de una hoja de Excel que no necesito para la extracción de datos. Pero, la información del encabezado podría tomar ...

1 la respuesta

¿Cómo funciona realmente el método pandas groupby?

Así que estaba tratando de entender la función pandas.dataFrame.groupby () y encontré este ejemplo en la documentación: In [1]: df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', ...: 'foo', 'bar', 'foo', 'foo'], ...: 'B' : ['one', 'one', ...

3 la respuesta

Envolviendo nombres de columnas en Python Pandas DataFrame o Jupyter Notebooks

Tengo títulos largos para algunas de mis columnas en mi marco de datos, y me gustaría poder ajustar el texto. Sé que esta funcionalidad está integrada en los pandas, como lo hago yo: pd.DataFrame(np.random.randn(2, 10), columns=['Very Long ...

1 la respuesta

Eliminar el signo de dólar de toda la trama de datos de Python Pandas

Estoy buscando eliminar signos de dólar de un marco completo de datos de pandas de Python. Es similar a esta publicación: Eliminar todo el personaje [https://stackoverflow.com/questions/42135409/removing-a-character-from-entire-data-frame] Sin ...

1 la respuesta

la unión / fusión interna en el marco de datos de pandas da más filas que el marco de datos izquierdo

Así es como se ven las columnas de los marcos de datos. df1 = 'número de dispositivo', 'fecha', .... << 10 otras columnas >> 3500 registros df2 = 'número de dispositivo', 'fecha', .... << 9 otras columnas >> 14,000 registros En cada marco de ...

2 la respuesta

Encuentra el nombre de la columna en pandas que coincida con una matriz

Tengo un gran marco de datos (5000 x 12039) y quiero obtener el nombre de la columna que coincida con una matriz numpy. Por ejemplo, si tengo la mesa m1lenhr m1lenmin m1citywt m1a12a cm1age cm1numb m1b1a m1b1b m1b12a m1b12b ...

2 la respuesta

Agregación basada en valores de fila "cercanos"

Tengo un marco de datos muy desordenado (webscraped) que desafortunadamente tiene muchas entradas dobles e incluso triples. La mayor parte del marco de datos se ve ...

7 la respuesta

Entretejer dos marcos de datos

Supongamos que tengo dos marcos de datosd1 yd2 d1 = pd.DataFrame(np.ones((3, 3), dtype=int), list('abc'), [0, 1, 2]) d2 = pd.DataFrame(np.zeros((3, 2), dtype=int), list('abc'), [3, 4]) d1 0 1 2 a 1 1 1 b 1 1 1 c 1 1 1 d2 3 4 a 0 0 b 0 0 c 0 ...

1 la respuesta

Apache Spark resta días de la columna de marca de tiempo

Estoy usando Spark Dataset y tengo problemas para restar días de una columna de marca de tiempo. Me gustaría restar días de la columna de marca de tiempo y obtener una nueva columna con formato de fecha y hora completo. Ejemplo: 2017-09-22 ...

1 la respuesta

Solución escalable para str.contains con lista de cadenas en pandas

Estoy analizando un marco de datos de pandasdf1 que contiene filas de objetos de cadena. Tengo una lista de referencias de palabras clave y necesito eliminar cada fila endf1 que contiene cualquier palabra de la lista de referencias. Actualmente, ...