на основном DF и выбранном DF @EmmaNej
я есть искраDataFrame
который имеет один столбец, который имеетмного нулей и очень мало (только 0,01% из них).
Я хотел бы взять случайную подвыборку, но стратифицированную - чтобы в этом столбце сохранялось отношение 1 к 0.
Можно ли это сделать в pyspark?
Я ищубез Scala решение и на основеDataFrame
а неRDD
-исходя из.