Resultados de la búsqueda a petición "pandas"
Carga de datos grandes de JSON de Twitter (7GB +) en Python
He configurado una transmisión pública a través de AWS para recopilar tweets y ahora quiero hacer un análisis preliminar. Todos mis datos fueron almacenados en un cubo S3 (en archivos de 5mb). Descargué todo y fusioné todos los archivos en uno. ...
El módulo openpyxl no tiene el atributo '__version__' cuando es importado por pandas
Mi rastreo de ejecutar pandas me lleva a: site-packages\pandas\io\excel.py line 58, in get_writer AttributeError: 'module' object has no attribute '__version__' Encontré este enlace a un problema de git en el repositorio de ...
Índice de valor máximo de pandas
Tengo un Pandas DataFrame con una combinación de nombres de pantalla, tweets, favoritos, etc. Quiero encontrar el valor máximo de 'favcount' (que ya he hecho) y también devolver el nombre de pantalla de ese 'tweet' df = pd.DataFrame() ...
Ordenar pandas DataFrame con función sobre valores de columna
Residencia enPython, ordena el marco de datos descendente con pandas [https://stackoverflow.com/questions/24988873/python-sort-descending-dataframe-with-pandas] : Dado: from pandas import DataFrame import pandas as pd d = ...
ylim diferente para ejes compartidos en pandas boxplot
Tengo una gráfica de caja de pandas agrupada, organícela en una cuadrícula (2,2): import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(np.random.rand(140, 4), columns=['A', 'B', 'C', 'D']) df['models'] = ...
¿Cómo dividir los datos en 3 conjuntos (tren, validación y prueba)?
Tengo un marco de datos de pandas y deseo dividirlo en 3 conjuntos separados. Sé que usandotrain_test_split [http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.train_test_split.html] desklearn.cross_validation, uno puede ...
localizar la posición numérica de un valor de índice no numérico
Considera la series abajo: s = pd.Series(np.arange(18, 0, -3), list('ABCDEF')) s A 18 B 15 C 12 D 9 E 6 F 3 dtype: int32Quiero obtener la posición numérica de'D' Esto lo hará, pero creo que todos podemos estar de acuerdo en que esto ...
Cómo recodificar y contar eficientemente
Tengo un csv grande con tres cadenas por fila en este formulario: a,c,d c,a,e f,g,f a,c,b c,a,d b,f,s c,a,cLeí en las dos primeras columnas recodificar las cadenas a enteros y luego eliminé los duplicados contando cuántas copias de cada fila ...
Confusión re: copia de pandas de advertencia de segmento de datos
He revisado un montón de preguntas y respuestas relacionadas con este problema, pero todavía encuentro que recibo esta copia de la advertencia de corte en lugares donde no lo espero. Además, está surgiendo en el código que funcionaba bien para mí ...
Separe los valores separados por comas dentro de las celdas individuales de la serie Pandas utilizando expresiones regulares
Tengo un archivo csv de una base de datos que he convertido en un Pandas DataFrame que estoy tratando de limpiar. Uno de los problemas es que se han ingresado múltiples valores en celdas individuales que deben dividirse. El factor de complicación ...