Dec 04, 2017, 05:27 PM

apache-spark-sql apache-spark pyspark

на основном DF и выбранном DF @EmmaNej

я есть искраDataFrame который имеет один столбец, который имеетмного нулей и очень мало (только 0,01% из них).

Я хотел бы взять случайную подвыборку, но стратифицированную - чтобы в этом столбце сохранялось отношение 1 к 0.

Можно ли это сделать в pyspark?

Я ищубез Scala решение и на основеDataFrameа неRDD-исходя из.

Ответы на вопрос(1)

Популярные вопросы

0 ответов

Java: как получить текущую дату в формате ISO 8601 SECOND

0 ответов

dismissmodalviewcontrolleranimated устарела сначала устарела в IOS 6

0 ответов

Кросс-таблица с большим или неопределенным количеством категорий

0 ответов

NodeJS - пошаговый отладчик для NodeJS

0 ответов

«Elseif» все еще существует? [закрыто]