на основном DF и выбранном DF @EmmaNej

я есть искраDataFrame который имеет один столбец, который имеетмного нулей и очень мало (только 0,01% из них).

Я хотел бы взять случайную подвыборку, но стратифицированную - чтобы в этом столбце сохранялось отношение 1 к 0.

Можно ли это сделать в pyspark?

Я ищубез Scala решение и на основеDataFrameа неRDD-исходя из.

Ответы на вопрос(1)

Ваш ответ на вопрос