@AltShift; как кто-то, кто столкнулся с той же ошибкой, имеет ли смысл в любом случае уже создавать вопрос, чтобы у остальных из нас было место, где мы могли бы следить за прогрессом в этом вопросе?

ти уверен, что об этом уже спрашивали, нопоиск через stackoverflow не ответил на мой вопрос. Не дубликат[2] так как хочу максимальную стоимость, не самый частый пункт. Я новичок в pyspark и пытаюсь сделать что-то действительно простое: я хочу в столбце groupBy «A», а затем сохранить только строку каждой группы, которая имеет максимальное значение в столбце «B». Нравится:

df_cleaned = df.groupBy("A").agg(F.max("B"))

К сожалению, это отбрасывает все остальные столбцы - df_cleaned содержит только столбцы «A» и максимальное значение B. Как мне вместо этого сохранить строки? («А», «В», «С» ...)

Ответы на вопрос(1)

Ваш ответ на вопрос