Resultados de la búsqueda a petición "dataframe"
Cómo leer ciertas columnas de Excel usando Pandas - Python
Estoy leyendo una hoja de Excel y quiero leer ciertas columnas: la columna 0 porque es el índice de fila y las columnas 22:37. Ahora esto es lo que hago: import pandas as pd import numpy as np file_loc = "path.xlsx" df = pd.read_excel(file_loc, ...
python: uso de estructuras de pandas con csv grande (iterar y tamaño de fragmento)
Tengo un archivo csv grande, de unos 600 MB con 11 millones de filas y quiero crear datos estadísticos como pivotes, histogramas, gráficos, etc. Obviamente, solo intento leerlo normalmente: df = pd.read_csv('Check400_900.csv', sep='\t')no ...
No se puede soltar NAN con dropna en pandas
Importo pandas como pd y ejecuto el siguiente código y obtengo el siguiente resultado Código: traindataset = pd.read_csv('/Users/train.csv') print traindataset.dtypes print traindataset.shape print traindataset.iloc[25,3] ...
Error de pandas "Solo se puede usar el descriptor de acceso .str con valores de cadena"
Tengo el siguiente archivo de entrada: "Name",97.7,0A,0A,65M,0A,100M,5M,75M,100M,90M,90M,99M,90M,0#,0N#,Y lo estoy leyendo con: #!/usr/bin/env python import pandas as pd import sys import numpy as np filename = sys.argv[1] df = ...
En R, ¿Cuál es la diferencia entre df ["x"] y df $ x
¿Dónde puedo encontrar información sobre las diferencias entre llamar a una columna dentro de un marco de datos a través de: df <- data.frame(x=1:20,y=letters[1:20],z=20:1) df$x df["x"]Ambos devuelven los "mismos" resultados, pero no ...
¿Cómo agrego una nueva columna a un Spark DataFrame (usando PySpark)?
Tengo un Spark DataFrame (usando PySpark 1.5.1) y me gustaría agregar una nueva columna. He intentado lo siguiente sin ningún éxito: type(randomed_hours) # => list # Create in Python and transform to RDD new_col = pd.DataFrame(randomed_hours, ...
El marco de datos de Spark transforma varias filas en una columna
Soy un novato para encender, y quierotransformarabajomarco de datos de origen (cargar desde archivo JSON): +--+-----+-----+ |A |count|major| +--+-----+-----+ | a| 1| m1| | a| 1| m2| | a| 2| m3| | a| 3| m4| | b| 4| m1| | b| 1| m2| | b| 2| m3| | ...
Convierta un archivo csv no estructurado en un marco de datos
Estoy aprendiendo R para la minería de texto. Tengo un horario de programa de TV en forma de CSV. Los programas generalmente comienzan a las 06:00 a.m. y continúan hasta las 05:00 a.m. del día siguiente, que se denomina día de transmisión. Por ...
Rango de cálculo de una fila
Quiero clasificar la identificación del usuario en función de un campo. Para el mismo valor del campo, el rango debe ser el mismo. Esa información está en la tabla Hive. p.ej. user value a 5 b 10 c 5 d 6 Rank a - 1 c - 1 d - 3 b - 4¿Cómo puedo ...
Reemplazar valores en una serie de pandas a través del diccionario de manera eficiente
Cómo reemplazar valores en una serie Pandass a través de un diccionariod ha sido preguntado y vuelto a preguntar muchas veces. El método recomendado (1 [https://stackoverflow.com/a/40855794/9209546], ...