Результаты поиска по запросу "pandas-groupby"

8 ответов

GroupBy панды DataFrame и выберите наиболее распространенное значение

У меня есть фрейм данных с тремя строковыми столбцами. Я знаю, что единственное значение в 3-м столбце действительно для каждой комбинации первых двух. Чтобы очистить данные, мне нужно сгруппировать данные по фрейму данных по первым двум столбцам ...

4 ответа

 был использован выше.

я есть следующие данные: Invoice NoStockCode Description Quantity CustomerID Country 536365 85123A WHITE HANGING HEART T-LIGHT HOLDER 6 17850 United Kingdom 536365 71053 WHITE METAL LANTERN 6 17850 United Kingdom 536365 84406B CREAM CUPID HEARTS ...

1 ответ

 после некоторых манипуляций.

трим, датафреймd: d = pd.DataFrame({'a': [0, 2, 1, 1, 1, 1, 1], 'b': [2, 1, 0, 1, 0, 0, 2], 'c': [1, 0, 2, 1, 0, 2, 2]} > a b c 0 0 2 1 1 2 1 0 2 1 0 2 3 1 1 1 4 1 0 0 5 1 0 2 6 1 2 2Я хочу разделить его на столбцыa в словарь так: {0: a b c 0 0 ...

ТОП публикаций

2 ответа

Ха-ха @MaxU Мне больше любопытно. Я не мог понять исходный код много. Кто-то может придумать более эффективный ответ :)

этот вопрос [https://stackoverflow.com/questions/49535966/what-is-the-pythonic-way-of-collapsing-values-into-a-set-for-multiple-columns-pe] оказалось, чтоdf.groupby(...).agg(set) а такжеdf.groupby(...).agg(lambda x: set(x)) дают разные ...

0 ответов

Чтобы получить фактические первое и последнее значения, выполните:

ликую это, потому что тема была поднята в другом вопросе / ответе, и поведение не очень хорошо задокументировано. Рассмотрим кадр данныхdf df = pd.DataFrame(dict( A=list('xxxyyy'), B=[np.nan, 1, 2, 3, 4, np.nan] )) A B 0 x NaN 1 x 1.0 2 x 2.0 3 ...

3 ответа

Несколько агрегаций одного столбца с использованием pandas GroupBy.agg ()

1 ответ

@ Л.Чу ты прав в своем понимании. Он считает размер каждой группы.

я есть следующий массив данных Pandas: Name | EventSignupNo | Attended | Points Smith | 0145 | Y | 20.24 Smith | 0174 | Y | 29.14 Smith | 0239 | N | 0 Adams | 0145 | N | 0 Adams | 0174 | Y | 33.43 Morgan | 0239 | Y | 31.23 Morgan | 0244 | Y | ...

0 ответов

Итератор раздвижного окна с использованием прокатки в пандах

Если это одна строка, я могу получить итератор следующим образом

1 ответ

Python Pandas Условная сумма с Groupby

Используя пример данных: df = pd.DataFrame({'key1' : ['a','a','b','b','a'], 'key2' : ['one', 'two', 'one', 'two', 'one'], 'data1' : np.random.randn(5), 'data2' : np. random.randn(5)})Д.Ф. data1 data2 key1 key2 0 0.361601 0.375297 a one 1 ...

1 ответ

@SDS Если вы считаете, что ответ предоставлен, отметьте его как принятый. Это помогает сосредоточиться на неотвеченных вопросах. Если ответы не помогли, можете ли вы дать отзыв о том, чего не хватает?

анные - это записи об отсутствии на фабрике. В некоторые дни пропуски отсутствуют, поэтому для этого дня не записываются данные или дата. Однако, и там, где это становится проблематичным с другими показанными примерами, в любой данный день может ...