Спасибо за решение. Я выглядел больше как фрейм данных
я есть фрейм данных, как показано ниже
cust_id req req_met
------- --- -------
1 r1 1
1 r2 0
1 r2 1
2 r1 1
3 r1 1
3 r2 1
4 r1 0
5 r1 1
5 r2 0
5 r1 1
Я должен посмотреть на клиентов, посмотреть, сколько у них требований и посмотреть, выполнили ли они хотя бы один раз. Может быть несколько записей с одним и тем же клиентом и требованием, один с удовлетворенным и не выполненным. В приведенном выше случае мой вывод должен быть
cust_id
-------
1
2
3
Что я сделал, так это
say initial dataframe is df
df1 = df.groupby('cust_id').countdistinct('req').alias('num_of_req').sum('req_met').alias('sum_req_met')
df2 = df1.filter(df1.num_of_req == df1.sum_req_met)
Но в некоторых случаях это не дает правильных результатов
Как это может быть сделано ?