Resultados de la búsqueda a petición "dataframe"

3 la respuesta

Los pandas expanden filas de los datos de la lista disponibles en la columna

Tengo un marco de datos como este en pandas: column1 column2 [a,b,c] 1 [d,e,f] 2 [g,h,i] 3Rendimiento esperado:column1 column2 a 1 b 1 c 1 d 2 e 2 f 2 g 3 h 3 i 3¿Cómo procesar estos datos?

2 la respuesta

Spark SQL UDF con parámetro de entrada complejo

Estoy tratando de usar UDF con el tipo de entrada Array of struct. Tengo la siguiente estructura de datos, esto es solo una parte relevante de una estructura más grande |--investments: array (nullable = true) | |-- element: struct (containsNull ...

1 la respuesta

Error de conversión de datos al aplicar una función a cada fila en pandas Python

Tengo un marco de datos en pandas en python que se parece a algo como esto: contest_login_count contest_participation_count ipn_ratio 0 1 1 0.000000 1 3 3 0.083333 2 3 3 0.000000 3 3 3 0.066667 4 5 13 0.102804 5 2 3 0.407407 6 1 3 0.000000 7 1 2 ...

1 la respuesta

Haga coincidir y reemplazar columnas de trama de datos por múltiples condiciones

Saludos, tengo dos marcos de datos con la siguiente estructura. DF1: Airlines HeadQ Date Cost_Index American PHX 07-31-2016 220 American ATL 08-31-2016 150 American ATL 10-31-2016 150 Delta ATL 10-31-2016 180 American ATL 08-31-2017 200El ...

3 la respuesta

Convierta datos de texto de objetos de solicitud a trama de datos con pandas

Utilizando solicitudes, estoy creando un objeto que está en formato .csv. ¿Cómo puedo escribir ese objeto en un DataFrame con pandas? Para obtener el objeto de solicitud en formato de texto: import requests import pandas as pd url = ...

2 la respuesta

No se puede establecer el índice de un marco de datos de pandas - obteniendo "KeyError"

Genero un marco de datos que se ve así (summaryDF): accuracy f1 precision recall 0 0.494 0.722433 0.722433 0.722433 0 0.290 0.826087 0.826087 0.826087 0 0.274 0.629630 0.629630 0.629630 0 0.278 0.628571 0.628571 0.628571 0 0.288 0.718750 ...

1 la respuesta

R: eliminar valores duplicados

Tengo un marco de datos de entrada como este: [/imgs/BNlOP.png] Quiero que la salida sea así: [/imgs/ZcqqW.png] Por ejemplo, quiero tomar el primer valor (Mary tiene vida), escanearlo contra todas las demás filas que tienen entradas COL1 ...

5 la respuesta

¿Cómo eliminar múltiples columnas que terminan con el mismo texto en Pandas?

Estoy tratando de eliminar un grupo de columnas de un conjunto de datos. Todas las variables a eliminar terminan con el texto "prefijo". Logré "reunirlos" en un grupo usando lo siguiente: [/imgs/w8AZ5.jpg] y luego probé una serie de formas de ...

1 la respuesta

los pandas obtienen el promedio de un grupo

Estoy tratando de encontrar el costo mensual promedio por user_id pero solo puedo obtener el costo promedio por usuario o el costo mensual por usuario. Como agrupo por usuario y mes, no hay forma de obtener el promedio del segundo groupby (mes) ...

3 la respuesta

¿Cómo preprocesar y cargar un archivo tsv de "big data" en un marco de datos de Python?

Actualmente estoy tratando de importar el siguiente archivo delimitado por tabulaciones grandes en una estructura similar a un marco de datos dentro de Python --- naturalmente estoy usandopandas marco de datos, aunque estoy abierto a otras ...