Resultados de la búsqueda a petición "pandas"
Python-pandas Reemplace NA con la mediana o media de un grupo en el marco de datos
Supongamos que tenemos un df: A B apple 1.0 apple 2.0 apple NA orange NA orange 7.0 melon 14.0 melon NA melon 15.0 melon 16.0para reemplazar el NA, podemos usar df ["B"]. fillna (df ["B"]. mediana ()), pero llenará NA con la mediana de todos los ...
python: uso de estructuras de pandas con csv grande (iterar y tamaño de fragmento)
Tengo un archivo csv grande, de unos 600 MB con 11 millones de filas y quiero crear datos estadísticos como pivotes, histogramas, gráficos, etc. Obviamente, solo intento leerlo normalmente: df = pd.read_csv('Check400_900.csv', sep='\t')no ...
No se puede soltar NAN con dropna en pandas
Importo pandas como pd y ejecuto el siguiente código y obtengo el siguiente resultado Código: traindataset = pd.read_csv('/Users/train.csv') print traindataset.dtypes print traindataset.shape print traindataset.iloc[25,3] ...
Comparar flotadores en una columna de pandas
Tengo el siguiente marco de datos: actual_credit min_required_credit 0 0.3 0.4 1 0.5 0.2 2 0.4 0.4 3 0.2 0.3 Necesito agregar una columna que indique dónde actual_credit> = min_required_credit. El resultado sería: actual_credit ...
Cómo leer ciertas columnas de Excel usando Pandas - Python
Estoy leyendo una hoja de Excel y quiero leer ciertas columnas: la columna 0 porque es el índice de fila y las columnas 22:37. Ahora esto es lo que hago: import pandas as pd import numpy as np file_loc = "path.xlsx" df = pd.read_excel(file_loc, ...
Correo electrónico de Python en formato HTML mimelib
Estoy tratando de enviar dos marcos de datos creados en Pandas Python como formato html en un correo electrónico enviado desde el script de python. Quiero escribir un texto y la tabla y repetir esto para dos marcos de datos más, pero el script ...
Inestabilidad de los cálculos del marco de datos de pandas
Me pregunto si alguien ha visto este problema con Pandas antes. Básicamente, estoy tratando de agregar, multiplicar y dividir DataFrames elemento por elemento (todos los marcos tienen índices y columnas idénticos), pero Pandas está escupiendo ...
Error de pandas "Solo se puede usar el descriptor de acceso .str con valores de cadena"
Tengo el siguiente archivo de entrada: "Name",97.7,0A,0A,65M,0A,100M,5M,75M,100M,90M,90M,99M,90M,0#,0N#,Y lo estoy leyendo con: #!/usr/bin/env python import pandas as pd import sys import numpy as np filename = sys.argv[1] df = ...
Crear una nueva columna en Panda utilizando la función lambda en dos columnas existentes
Puedo agregar una nueva columna en Panda definiendo la función del usuario y luego usando apply. Sin embargo, quiero hacer esto usandolambda; ¿Hay alguna forma de evitarlo? Por ejemplo,df tiene dos columnasa yb. Quiero crear una nueva columnac ...
Comparación de columnas booleanas en Python / Pandas
Estoy tratando de tomar 2 columnas en Pandas que contengan valores booleanos y crear una tercera columna que sea el OR de estos valores booleanos. Por ejemplo, mi marco de datos actualmente contiene A y B, y quiero crear C. A B C True True True ...