Resultados de la búsqueda a petición "dataframe"

2 la respuesta

Guarde la columna pandas (cadena / objeto) como VARCHAR en Oracle DB en lugar de CLOB (comportamiento predeterminado)

Estoy tratando de transferir un marco de datos a la base de datos Oracle, pero la transferencia está tardando demasiado, porque el tipo de datos de la variable se muestra comocloben oráculo Sin embargo, creo que si convierto el tipo de datos ...

4 la respuesta

Eficiente cálculo de la beta de acciones de Python Pandas en muchos marcos de datos

Tengo muchos (4000+) CSV de datos de stock (Fecha, Abierto, Alto, Bajo, Cerrado) que importo en marcos de datos de Pandas individuales para realizar análisis. Soy nuevo en Python y quiero calcular una beta móvil de 12 meses para cada acción, ...

2 la respuesta

cómo leer json con esquema en marcos de datos de chispa / spark sql

sql / dataframes, ayúdame o proporciona alguna buena sugerencia sobre cómo leer este json { "billdate":"2016-08-08', "accountid":"xxx" "accountdetails":{ "total":"1.1" "category":[ { "desc":"one", "currentinfo":{ "value":"10" }, "subcategory":[ ...

3 la respuesta

Cómo reasignar identificadores a números consecutivos rápidamente

Tengo un gran archivo csv con líneas que se ve como stringa,stringb stringb,stringc stringd,stringaNecesito convertirlo para que los identificadores se numeren consecutivamente desde 0. En este caso, lo siguiente funcionaría 0,1 1,2 3,0Mi ...

4 la respuesta

Agrupación de trama de datos R por valores conectados

No encontré una solución para este problema de agrupación común en R: Este es mi conjunto de datos original ID State 1 A 2 A 3 B 4 B 5 B 6 A 7 A 8 A 9 C 10 CEste debería ser mi conjunto de datos resultante agrupado State min(ID) max(ID) A 1 2 ...

2 la respuesta

Cómo transmitir y manipular un archivo de datos grande en python

Tengo un archivo de texto relativamente grande (1 GB) que quiero reducir en tamaño al sumar en todas las categorías: Geography AgeGroup Gender Race Count County1 1 M 1 12 County1 2 M 1 3 County1 2 M 2 0A: Geography Count County1 15 County2 ...

1 la respuesta

Número de particiones del marco de datos de Spark

¿Alguien puede explicar sobre el número de particiones que se crearán para un Spark Dataframe. Sé que para un RDD, mientras lo creamos podemos mencionar el número de particiones como a continuación. val RDD1 = sc.textFile("path" , 6)Pero para ...

2 la respuesta

obtener el primer y último valor en un grupo

Tengo un marco de datosdf df = pd.DataFrame(np.arange(20).reshape(10, -1), [['a', 'a', 'a', 'a', 'b', 'b', 'b', 'c', 'c', 'd'], ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']], ['X', 'Y'])¿Cómo obtengo la primera y la última fila, agrupadas ...

1 la respuesta

Acoplar Pandas DataFrame de la lista json anidada

Quizás alguien pueda ayudarme. Traté de aplanar el siguiente ist en un marco de datos de pandas: [{u'_id': u'2', u'_index': u'list', u'_score': 1.4142135, u'_source': {u'name': u'name3'}, u'_type': u'doc'}, {u'_id': u'5', u'_index': u'list', ...

2 la respuesta

¿Cómo crear una variable "condicional" en R?

Quiero crear una variable ficticia condicional. Suponga que tengo un conjunto de datos que se parece a esto: Subject Year X X1 A 1990 1 0 A 1991 1 0 A 1992 2 0 A 1993 3 0 A 1994 4 0 A 1995 4 1 B 1990 0 0 B 1991 1 0 B 1992 1 0 B 1993 2 0 B 1994 3 ...