Resultados de la búsqueda a petición "pandas"
Los pandas leen el archivo csv con resultados de valores flotantes en redondeos extraños y dígitos decimales
Tengo un archivo csv que contiene valores numéricos como1524.449677. Siempre hay exactamente 6 decimales. Cuando importo el archivo csv (y otras columnas) a través de pandasread_csv, la columna obtiene automáticamente el tipo de datosobject. Mi ...
Tamaño máximo del marco de datos de pandas
Estoy tratando de leer en un conjunto de datos algo grande usandopandas read_csv oread_stata funciones, pero sigo encontrándome conMemory Errors. ¿Cuál es el tamaño máximo de un marco de datos? Tengo entendido que los marcos de datos deberían ...
Agregar el marco de datos de Pandas a la tabla sqlite por clave primaria
Quiero agregar el marco de datos de Pandas a una tabla existente en una base de datos sqlite llamada 'NewTable'. NewTable tiene tres campos (ID, Nombre, Edad) y la ID es la clave principal. Mi conexión de base de datos: import sqlite3 ...
Marco de datos de pandas y codificación de caracteres al leer el archivo de Excel
Estoy leyendo un archivo de Excel que tiene varios datos numéricos y categóricos. Las columnas name_string contienen caracteres en un idioma extranjero. Cuando trato de ver el contenido de la columna name_string, obtengo los resultados que ...
Pandas DataFrame, ¿Cómo elimino todas las columnas y filas que suman 0?
Tengo un DataFrame con filas y columnas que suman 0. A B C D 0 1 1 0 1 1 0 0 0 0 2 1 0 0 1 3 0 1 0 0 4 1 1 0 1El resultado final debe ser A B D 0 1 1 1 2 1 0 1 3 0 1 0 4 1 1 1Observe que las filas y columnas que solo tenían ceros se han eliminado.
Procesamiento de datos con agregar columnas dinámicamente en el marco de datos de Python Pandas
Tengo el siguiente problema. Digamos que este es mi CSV id f1 f2 f3 1 4 5 5 1 3 1 0 1 7 4 4 1 4 3 1 1 1 4 6 2 2 6 0 ..........Entonces, tengo filas que se pueden agrupar por id. Quiero crear un csv como a continuación como salida. f1 f2 f3 f1_n ...
Devuelve múltiples columnas de aplicar pandas
Tengo un DataFrame de pandas,df_test. Contiene una columna 'tamaño' que representa el tamaño en bytes. He calculado KB, MB y GB usando el siguiente código: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, ...
Python pandas / matplotlib anotando etiquetas encima de las columnas del gráfico de barras
¿Cómo agrego la etiqueta para que el valor se muestre sobre las barras en el gráfico de barras aquí: import pandas as pd import matplotlib.pyplot as plt df=pd.DataFrame({'Users': [ 'Bob', 'Jim', 'Ted', 'Jesus', 'James'], 'Score': [10,2,5,6,7],}) ...
Los pandas convierten Dataframe a Json anidado
Mi pregunta es esencialmente la opuesta a esta: Cree un marco de datos de pandas a partir de JSON profundamente anidado [https://stackoverflow.com/questions/21494030/create-a-pandas-dataframe-from-deeply-nested-json] Me pregunto si es posible ...
¿Por qué Apache-Spark - Python es tan lento localmente en comparación con los pandas?
Un novato chispa aquí. Recientemente comencé a jugar con la chispa en mi máquina local en dos núcleos usando el comando. pyspark - maestro local [2] Tengo un archivo de texto de 393 Mb que tiene casi un millón de filas. Quería realizar alguna ...