Выход:

тавляю таблицу топ-3 культур по округам. В некоторых округах одни и те же сорта культур в одинаковом порядке. Другие округа имеют одинаковые сорта культур в другом порядке.

df1 = pd.DataFrame( { 
    "County" : ["Harney", "Baker", "Wheeler", "Hood River", "Wasco" , "Morrow","Union","Lake"] , 
    "Crop1" : ["grain", "melons", "melons", "apples", "pears", "raddish","pears","pears"],
    "Crop2" : ["melons","grain","grain","melons","carrots","pears","carrots","carrots"],
    "Crop3": ["apples","apples","apples","grain","raddish","carrots","raddish","raddish"],
    "Total_pop": [2000,1500,3000,1500,2000,2500,2700,2000]} )

Я могу сделать групповой на Crop1, Crop2 и Crop3 и получить сумму total_pop:

df1_grouped=df1.groupby(['Crop1',"Crop2","Crop3"])['Total_pop'].sum().reset_index()

Это дает мне сумму для конкретных комбинаций культур:

df1_grouped
apples  melons  grain   1500
grain   melons  apples  2000
melons  grain   apples  4500
pears   carrots raddish 6700
raddish pears   carrots 2500

Однако я хотел бы получить общую популяцию по различным комбинациям культур - независимо от того, была ли указанная культура урожая1, урожая2 или урожая3. Желаемый результат будет следующим:

apples  melons   grain    8000
pears   carrots  raddish  9200 

Спасибо за любые рекомендации.

Ответы на вопрос(4)

Ваш ответ на вопрос