Найти минимум для отметки времени через группу данных SparkBy
Когда я пытаюсь сгруппировать мой фрейм данных по столбцу, тогда пытаюсь найти минимум для каждой группировкиgroupbyDatafram.min('timestampCol')
кажется, я не могу сделать это на нечисловых столбцах. Тогда как мне правильно отфильтровать минимальную (самую раннюю) дату в группе?
Я передаю поток данных из экземпляра postgresql S3, так что данные уже настроены.