Выход:
тавляю таблицу топ-3 культур по округам. В некоторых округах одни и те же сорта культур в одинаковом порядке. Другие округа имеют одинаковые сорта культур в другом порядке.
df1 = pd.DataFrame( {
"County" : ["Harney", "Baker", "Wheeler", "Hood River", "Wasco" , "Morrow","Union","Lake"] ,
"Crop1" : ["grain", "melons", "melons", "apples", "pears", "raddish","pears","pears"],
"Crop2" : ["melons","grain","grain","melons","carrots","pears","carrots","carrots"],
"Crop3": ["apples","apples","apples","grain","raddish","carrots","raddish","raddish"],
"Total_pop": [2000,1500,3000,1500,2000,2500,2700,2000]} )
Я могу сделать групповой на Crop1, Crop2 и Crop3 и получить сумму total_pop:
df1_grouped=df1.groupby(['Crop1',"Crop2","Crop3"])['Total_pop'].sum().reset_index()
Это дает мне сумму для конкретных комбинаций культур:
df1_grouped
apples melons grain 1500
grain melons apples 2000
melons grain apples 4500
pears carrots raddish 6700
raddish pears carrots 2500
Однако я хотел бы получить общую популяцию по различным комбинациям культур - независимо от того, была ли указанная культура урожая1, урожая2 или урожая3. Желаемый результат будет следующим:
apples melons grain 8000
pears carrots raddish 9200
Спасибо за любые рекомендации.