Resultados de la búsqueda a petición "dataframe"
Guarde la columna pandas (cadena / objeto) como VARCHAR en Oracle DB en lugar de CLOB (comportamiento predeterminado)
Estoy tratando de transferir un marco de datos a la base de datos Oracle, pero la transferencia está tardando demasiado, porque el tipo de datos de la variable se muestra comocloben oráculo Sin embargo, creo que si convierto el tipo de datos ...
Eficiente cálculo de la beta de acciones de Python Pandas en muchos marcos de datos
Tengo muchos (4000+) CSV de datos de stock (Fecha, Abierto, Alto, Bajo, Cerrado) que importo en marcos de datos de Pandas individuales para realizar análisis. Soy nuevo en Python y quiero calcular una beta móvil de 12 meses para cada acción, ...
cómo leer json con esquema en marcos de datos de chispa / spark sql
sql / dataframes, ayúdame o proporciona alguna buena sugerencia sobre cómo leer este json { "billdate":"2016-08-08', "accountid":"xxx" "accountdetails":{ "total":"1.1" "category":[ { "desc":"one", "currentinfo":{ "value":"10" }, "subcategory":[ ...
Cómo reasignar identificadores a números consecutivos rápidamente
Tengo un gran archivo csv con líneas que se ve como stringa,stringb stringb,stringc stringd,stringaNecesito convertirlo para que los identificadores se numeren consecutivamente desde 0. En este caso, lo siguiente funcionaría 0,1 1,2 3,0Mi ...
Agrupación de trama de datos R por valores conectados
No encontré una solución para este problema de agrupación común en R: Este es mi conjunto de datos original ID State 1 A 2 A 3 B 4 B 5 B 6 A 7 A 8 A 9 C 10 CEste debería ser mi conjunto de datos resultante agrupado State min(ID) max(ID) A 1 2 ...
Cómo transmitir y manipular un archivo de datos grande en python
Tengo un archivo de texto relativamente grande (1 GB) que quiero reducir en tamaño al sumar en todas las categorías: Geography AgeGroup Gender Race Count County1 1 M 1 12 County1 2 M 1 3 County1 2 M 2 0A: Geography Count County1 15 County2 ...
Número de particiones del marco de datos de Spark
¿Alguien puede explicar sobre el número de particiones que se crearán para un Spark Dataframe. Sé que para un RDD, mientras lo creamos podemos mencionar el número de particiones como a continuación. val RDD1 = sc.textFile("path" , 6)Pero para ...
obtener el primer y último valor en un grupo
Tengo un marco de datosdf df = pd.DataFrame(np.arange(20).reshape(10, -1), [['a', 'a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd'], ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']], ['X', 'Y'])¿Cómo obtengo la primera y la última fila, agrupadas ...
Acoplar Pandas DataFrame de la lista json anidada
Quizás alguien pueda ayudarme. Traté de aplanar el siguiente ist en un marco de datos de pandas: [{u'_id': u'2', u'_index': u'list', u'_score': 1.4142135, u'_source': {u'name': u'name3'}, u'_type': u'doc'}, {u'_id': u'5', u'_index': u'list', ...
¿Cómo crear una variable "condicional" en R?
Quiero crear una variable ficticia condicional. Suponga que tengo un conjunto de datos que se parece a esto: Subject Year X X1 A 1990 1 0 A 1991 1 0 A 1992 2 0 A 1993 3 0 A 1994 4 0 A 1995 4 1 B 1990 0 0 B 1991 1 0 B 1992 1 0 B 1993 2 0 B 1994 3 ...