Resultados de la búsqueda a petición "dataframe"

2 la respuesta

Cómo leer ciertas columnas de Excel usando Pandas - Python

Estoy leyendo una hoja de Excel y quiero leer ciertas columnas: la columna 0 porque es el índice de fila y las columnas 22:37. Ahora esto es lo que hago: import pandas as pd import numpy as np file_loc = "path.xlsx" df = pd.read_excel(file_loc, ...

3 la respuesta

python: uso de estructuras de pandas con csv grande (iterar y tamaño de fragmento)

Tengo un archivo csv grande, de unos 600 MB con 11 millones de filas y quiero crear datos estadísticos como pivotes, histogramas, gráficos, etc. Obviamente, solo intento leerlo normalmente: df = pd.read_csv('Check400_900.csv', sep='\t')no ...

3 la respuesta

No se puede soltar NAN con dropna en pandas

Importo pandas como pd y ejecuto el siguiente código y obtengo el siguiente resultado Código: traindataset = pd.read_csv('/Users/train.csv') print traindataset.dtypes print traindataset.shape print traindataset.iloc[25,3] ...

3 la respuesta

Error de pandas "Solo se puede usar el descriptor de acceso .str con valores de cadena"

Tengo el siguiente archivo de entrada: "Name",97.7,0A,0A,65M,0A,100M,5M,75M,100M,90M,90M,99M,90M,0#,0N#,Y lo estoy leyendo con: #!/usr/bin/env python import pandas as pd import sys import numpy as np filename = sys.argv[1] df = ...

7 la respuesta

En R, ¿Cuál es la diferencia entre df ["x"] y df $ x

¿Dónde puedo encontrar información sobre las diferencias entre llamar a una columna dentro de un marco de datos a través de: df <- data.frame(x=1:20,y=letters[1:20],z=20:1) df$x df["x"]Ambos devuelven los "mismos" resultados, pero no ...

6 la respuesta

¿Cómo agrego una nueva columna a un Spark DataFrame (usando PySpark)?

Tengo un Spark DataFrame (usando PySpark 1.5.1) y me gustaría agregar una nueva columna. He intentado lo siguiente sin ningún éxito: type(randomed_hours) # => list # Create in Python and transform to RDD new_col = pd.DataFrame(randomed_hours, ...

2 la respuesta

El marco de datos de Spark transforma varias filas en una columna

Soy un novato para encender, y quierotransformarabajomarco de datos de origen (cargar desde archivo JSON): +--+-----+-----+ |A |count|major| +--+-----+-----+ | a| 1| m1| | a| 1| m2| | a| 2| m3| | a| 3| m4| | b| 4| m1| | b| 1| m2| | b| 2| m3| | ...

3 la respuesta

Convierta un archivo csv no estructurado en un marco de datos

Estoy aprendiendo R para la minería de texto. Tengo un horario de programa de TV en forma de CSV. Los programas generalmente comienzan a las 06:00 a.m. y continúan hasta las 05:00 a.m. del día siguiente, que se denomina día de transmisión. Por ...

1 la respuesta

Rango de cálculo de una fila

Quiero clasificar la identificación del usuario en función de un campo. Para el mismo valor del campo, el rango debe ser el mismo. Esa información está en la tabla Hive. p.ej. user value a 5 b 10 c 5 d 6 Rank a - 1 c - 1 d - 3 b - 4¿Cómo puedo ...

1 la respuesta

Reemplazar valores en una serie de pandas a través del diccionario de manera eficiente

Cómo reemplazar valores en una serie Pandass a través de un diccionariod ha sido preguntado y vuelto a preguntar muchas veces. El método recomendado (1 [https://stackoverflow.com/a/40855794/9209546], ...