Spark - scala: перемешать RDD / разбить RDD на две случайные части случайным образом
Как я могу взять массив rdd искры и разбить его случайным образом на две трети, чтобы каждый rdd включал некоторую часть данных (скажем, 97% и 3%).
Я думал перетасовать список, а затемshuffledList.take((0.97*rddList.count).toInt)
Но как я могу перемешать RDD?
Или есть лучший способ разделить список?