Уменьшите пару ключ-значение в пару списков ключей с помощью Apache Spark
Я пишу приложение Spark и хочу объединить набор пар ключ-значение(K, V1), (K, V2), ..., (K, Vn)
в одну пару ключ-многозначность(K, [V1, V2, ..., Vn])
, Я чувствую, что должен быть в состоянии сделать это, используяreduceByKey
функция с чем-то вроде аромата:
My_KMV = My_KV.reduce(lambda a, b: a.append([b]))
Ошибка, которую я получаю, когда это происходит:
Объект 'NoneType' не имеет атрибута 'append'.
Мои ключи - целые числа, а значения V1, ..., Vn - кортежи. Моя цель - создать одну пару с ключом и списком значений (кортежей).