Resultados de la búsqueda a petición "pandas"

2 la respuesta

Carga de datos grandes de JSON de Twitter (7GB +) en Python

He configurado una transmisión pública a través de AWS para recopilar tweets y ahora quiero hacer un análisis preliminar. Todos mis datos fueron almacenados en un cubo S3 (en archivos de 5mb). Descargué todo y fusioné todos los archivos en uno. ...

3 la respuesta

El módulo openpyxl no tiene el atributo '__version__' cuando es importado por pandas

Mi rastreo de ejecutar pandas me lleva a: site-packages\pandas\io\excel.py line 58, in get_writer AttributeError: 'module' object has no attribute '__version__' Encontré este enlace a un problema de git en el repositorio de ...

2 la respuesta

Índice de valor máximo de pandas

Tengo un Pandas DataFrame con una combinación de nombres de pantalla, tweets, favoritos, etc. Quiero encontrar el valor máximo de 'favcount' (que ya he hecho) y también devolver el nombre de pantalla de ese 'tweet' df = pd.DataFrame() ...

3 la respuesta

Ordenar pandas DataFrame con función sobre valores de columna

Residencia enPython, ordena el marco de datos descendente con pandas [https://stackoverflow.com/questions/24988873/python-sort-descending-dataframe-with-pandas] : Dado: from pandas import DataFrame import pandas as pd d = ...

1 la respuesta

ylim diferente para ejes compartidos en pandas boxplot

Tengo una gráfica de caja de pandas agrupada, organícela en una cuadrícula (2,2): import pandas as pd import numpy as np import matplotlib.pyplot as plt df = pd.DataFrame(np.random.rand(140, 4), columns=['A', 'B', 'C', 'D']) df['models'] = ...

5 la respuesta

¿Cómo dividir los datos en 3 conjuntos (tren, validación y prueba)?

Tengo un marco de datos de pandas y deseo dividirlo en 3 conjuntos separados. Sé que usandotrain_test_split [http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.train_test_split.html] desklearn.cross_validation, uno puede ...

3 la respuesta

localizar la posición numérica de un valor de índice no numérico

Considera la series abajo: s = pd.Series(np.arange(18, 0, -3), list('ABCDEF')) s A 18 B 15 C 12 D 9 E 6 F 3 dtype: int32Quiero obtener la posición numérica de'D' Esto lo hará, pero creo que todos podemos estar de acuerdo en que esto ...

2 la respuesta

Cómo recodificar y contar eficientemente

Tengo un csv grande con tres cadenas por fila en este formulario: a,c,d c,a,e f,g,f a,c,b c,a,d b,f,s c,a,cLeí en las dos primeras columnas recodificar las cadenas a enteros y luego eliminé los duplicados contando cuántas copias de cada fila ...

1 la respuesta

Confusión re: copia de pandas de advertencia de segmento de datos

He revisado un montón de preguntas y respuestas relacionadas con este problema, pero todavía encuentro que recibo esta copia de la advertencia de corte en lugares donde no lo espero. Además, está surgiendo en el código que funcionaba bien para mí ...

1 la respuesta

Separe los valores separados por comas dentro de las celdas individuales de la serie Pandas utilizando expresiones regulares

Tengo un archivo csv de una base de datos que he convertido en un Pandas DataFrame que estoy tratando de limpiar. Uno de los problemas es que se han ingresado múltiples valores en celdas individuales que deben dividirse. El factor de complicación ...