Resultados de la búsqueda a petición "pandas"
Cuente elementos mayores que un valor en pandas groupby
Tengo el conjunto de datos de Yelp y quiero contar todas las reseñas que tengan más de 3 estrellas. Obtengo el recuento de comentarios al hacer esto: reviews.groupby('business_id')['stars'].count()Ahora quiero obtener el recuento de comentarios ...
pandas, aplique múltiples funciones de múltiples columnas para agrupar por objeto
Quiero aplicar múltiples funciones de múltiples columnas a un objeto groupby que da como resultado un nuevopandas.DataFrame. Sé cómo hacerlo en pasos separados: by_user = lasts.groupby('user') elapsed_days = by_user.apply(lambda ...
Conteo acumulativo de pandas
Tengo un marco de datos como este: 0 04:10 obj1 1 04:10 obj1 2 04:11 obj1 3 04:12 obj2 4 04:12 obj2 5 04:12 obj1 6 04:13 obj2Quería obtener un recuento acumulativo de todos los objetos como este: idx time object obj1_count obj2_count 0 04:10 ...
Python Flatten Multiplicar diccionario JSON anidado con pandas
Estoy trabajando con una respuesta JSON que está formateada como un diccionario anidado a continuación: {u'addresses': [], u'application_ids': [20855193], u'applications': [{u'answers': [{u'answer': u'Indeed ', u'question': u'How did you ...
Dask equivalente a reemplazar pandas?
Algo que uso regularmente en los pandas es la operación .replace. ¿Me cuesta ver cómo uno realiza fácilmente esta misma operación en un marco de datos dask? df.replace('PASS', '0', inplace=True) df.replace('FAIL', '1', inplace=True)
Quiere saber la diferencia entre pd.factorize, pd.get_dummies, sklearn.preprocessing.LableEncoder y OneHotEncoder [cerrado]
Las cuatro funciones me parecen muy similares. En algunas situaciones, algunos de ellos pueden dar el mismo resultado, otros no. ¡Cualquier ayuda será agradecida! Ahora lo sé y asumo que internamente,factorize yLabelEncoder funcionan de la misma ...
pandas concat genera valores nan
Tengo curiosidad por qué una simple concatenación de dos marcos de datos en pandas: shape: (66441, 1) dtypes: prediction int64 dtype: object isnull().sum(): prediction 0 dtype: int64 shape: (66441, 1) CUSTOMER_ID int64 dtype: ...
Filtrar filas después de groupby pandas
Tengo una mesa en pandas: import pandas as pd df = pd.DataFrame({ 'LeafID':[1,1,2,1,3,3,1,6,3,5,1], 'pidx':[10,10,300,10,30,40,20,10,30,45,20], 'pidy':[20,20,400,20,15,20,12,43,54,112,23], 'count':[10,20,30,40,80,10,20,50,30,10,70], ...
Modifique el código de remuestreo de OHLC según la advertencia obsoleta
Problema: Cuando se trabaja con datos de mercado y se vuelven a muestrear datos intradía al marco de tiempo diario de la siguiente manera: ohlc_dict = { 'Open':'first', 'High':'max', 'Low':'min', 'Last': 'last', 'Volume': 'sum'} ...
los pandas convierten columnas a porcentajes de los totales
Tengo un marco de datos con 4 columnas, una ID y tres categorías en las que los resultados cayeron <80% 80-90 >90 id 1 2 4 4 2 3 6 1 3 7 0 3Me gustaría convertirlo a porcentajes, es decir: <80% 80-90 >90 id 1 20% 40% 40% 2 30% 60% 10% 3 70% 0% ...