Результаты поиска по запросу "pandas-groupby"

2 ответа

Вы можете использовать ранг

аюсь создать новую переменную, которая подсчитывает, сколько раз был просмотрен один и тот же идентификатор с течением времени. Нужно перейти с этого фрейма id clae6 year quarter 1 475230.0 2007 1 1 475230.0 2007 2 1 475230.0 2007 3 1 475230.0 ...

5 ответов

Следовательно, я бы проголосовал за то, чтобы сделать наблюдаемое = True поведением по умолчанию.

я проблемы с использованиемпанды групповуха [https://pandas.pydata.org/pandas-docs/stable/groupby.html]с категориальными данными. Теоретически, это должно быть супер эффективно: вы группируете и индексируете через целые числа, а не через строки. ...

3 ответа

В некотором смысле имеет смысл, что вы можете маркировать кортежи, как это ... приятно.

я есть df, который я группирую по двум столбцам. Я хочу посчитать каждую группу последовательно. Код ниже подсчитывает каждую строку в группе последовательно. Это кажется легче, чем я думаю, но не могу понять это. df = pd.DataFrame({ 'Key': ...

ТОП публикаций

1 ответ

но получил эту ошибку:

я есть некоторые данные, которые выглядят так, и называются «test_df» ID Year Value Value2 0 A 2012 1 4 1 A 2012 2 5 2 A 2013 4 6 3 A 2013 5 7 4 B 2014 6 8 5 B 2014 7 4 6 B 2013 8 8Я хочу, чтобы это выглядело так: ID Year Value_avg Value2_avg A ...

1 ответ

Новый ключ Создать: Используя изменение знака, если мы добавим изменение, то оно будет принадлежать группе гнезд.

In [46]: d = np.random.randn(10, 1) * 2 In [47]: df = pd.DataFrame(d.astype(int), columns=['data'])аюсь создать столбец cumsum, где он должен сбрасываться после изменения знака в столбце данных, как это data custom_cumsum 0 -2 -2 1 -1 -3 2 1 1 3 ...

3 ответа

выше) может быть еще быстрее.)

у создать скользящую сгруппированную совокупную сумму. Я могу получить результат с помощью итерации, но хотел посмотреть, есть ли более разумный способ. Вот как выглядят исходные данные: Per C V 1 c 3 1 a 4 1 c 1 2 a 6 2 b 5 3 j 7 4 x 6 4 x 5 4 ...

2 ответа

Ха-ха @MaxU Мне больше любопытно. Я не мог понять исходный код много. Кто-то может придумать более эффективный ответ :)

этот вопрос [https://stackoverflow.com/questions/49535966/what-is-the-pythonic-way-of-collapsing-values-into-a-set-for-multiple-columns-pe] оказалось, чтоdf.groupby(...).agg(set) а такжеdf.groupby(...).agg(lambda x: set(x)) дают разные ...

1 ответ

 после некоторых манипуляций.

трим, датафреймd: d = pd.DataFrame({'a': [0, 2, 1, 1, 1, 1, 1], 'b': [2, 1, 0, 1, 0, 0, 2], 'c': [1, 0, 2, 1, 0, 2, 2]} > a b c 0 0 2 1 1 2 1 0 2 1 0 2 3 1 1 1 4 1 0 0 5 1 0 2 6 1 2 2Я хочу разделить его на столбцыa в словарь так: {0: a b c 0 0 ...

2 ответа

Небольшая альтернатива. Поскольку кортежи, которые мы перебираем, называются кортежами, мы можем получить доступ к каждому элементу по имени столбца, который он представляет.

вая следующий кадр данных панд: ColA ColB ColC 0 a1 t 1 1 a2 t 2 2 a3 d 3 3 a4 d 4Я хочу получить словарь словаря. Но мне удалось создать только следующее: d = {t : [1, 2], d : [3, 4]}по: d = {k: list(v) for k,v in ...

4 ответа

 был использован выше.

я есть следующие данные: Invoice NoStockCode Description Quantity CustomerID Country 536365 85123A WHITE HANGING HEART T-LIGHT HOLDER 6 17850 United Kingdom 536365 71053 WHITE METAL LANTERN 6 17850 United Kingdom 536365 84406B CREAM CUPID HEARTS ...