Resultados de la búsqueda a petición "pandas"

1 la respuesta

Cuente elementos mayores que un valor en pandas groupby

Tengo el conjunto de datos de Yelp y quiero contar todas las reseñas que tengan más de 3 estrellas. Obtengo el recuento de comentarios al hacer esto: reviews.groupby('business_id')['stars'].count()Ahora quiero obtener el recuento de comentarios ...

6 la respuesta

pandas, aplique múltiples funciones de múltiples columnas para agrupar por objeto

Quiero aplicar múltiples funciones de múltiples columnas a un objeto groupby que da como resultado un nuevopandas.DataFrame. Sé cómo hacerlo en pasos separados: by_user = lasts.groupby('user') elapsed_days = by_user.apply(lambda ...

4 la respuesta

Conteo acumulativo de pandas

Tengo un marco de datos como este: 0 04:10 obj1 1 04:10 obj1 2 04:11 obj1 3 04:12 obj2 4 04:12 obj2 5 04:12 obj1 6 04:13 obj2Quería obtener un recuento acumulativo de todos los objetos como este: idx time object obj1_count obj2_count 0 04:10 ...

1 la respuesta

Python Flatten Multiplicar diccionario JSON anidado con pandas

Estoy trabajando con una respuesta JSON que está formateada como un diccionario anidado a continuación: {u'addresses': [], u'application_ids': [20855193], u'applications': [{u'answers': [{u'answer': u'Indeed ', u'question': u'How did you ...

2 la respuesta

Dask equivalente a reemplazar pandas?

Algo que uso regularmente en los pandas es la operación .replace. ¿Me cuesta ver cómo uno realiza fácilmente esta misma operación en un marco de datos dask? df.replace('PASS', '0', inplace=True) df.replace('FAIL', '1', inplace=True)

1 la respuesta

Quiere saber la diferencia entre pd.factorize, pd.get_dummies, sklearn.preprocessing.LableEncoder y OneHotEncoder [cerrado]

Las cuatro funciones me parecen muy similares. En algunas situaciones, algunos de ellos pueden dar el mismo resultado, otros no. ¡Cualquier ayuda será agradecida! Ahora lo sé y asumo que internamente,factorize yLabelEncoder funcionan de la misma ...

1 la respuesta

pandas concat genera valores nan

Tengo curiosidad por qué una simple concatenación de dos marcos de datos en pandas: shape: (66441, 1) dtypes: prediction int64 dtype: object isnull().sum(): prediction 0 dtype: int64 shape: (66441, 1) CUSTOMER_ID int64 dtype: ...

4 la respuesta

Filtrar filas después de groupby pandas

Tengo una mesa en pandas: import pandas as pd df = pd.DataFrame({ 'LeafID':[1,1,2,1,3,3,1,6,3,5,1], 'pidx':[10,10,300,10,30,40,20,10,30,45,20], 'pidy':[20,20,400,20,15,20,12,43,54,112,23], 'count':[10,20,30,40,80,10,20,50,30,10,70], ...

1 la respuesta

Modifique el código de remuestreo de OHLC según la advertencia obsoleta

Problema: Cuando se trabaja con datos de mercado y se vuelven a muestrear datos intradía al marco de tiempo diario de la siguiente manera: ohlc_dict = { 'Open':'first', 'High':'max', 'Low':'min', 'Last': 'last', 'Volume': 'sum'} ...

1 la respuesta

los pandas convierten columnas a porcentajes de los totales

Tengo un marco de datos con 4 columnas, una ID y tres categorías en las que los resultados cayeron <80% 80-90 >90 id 1 2 4 4 2 3 6 1 3 7 0 3Me gustaría convertirlo a porcentajes, es decir: <80% 80-90 >90 id 1 20% 40% 40% 2 30% 60% 10% 3 70% 0% ...