Reduzca un par clave-valor en un par clave-lista con Apache Spark
Estoy escribiendo una aplicación Spark y quiero combinar un conjunto de pares clave-valor(K, V1), (K, V2), ..., (K, Vn)
en un par clave-valor múltiple(K, [V1, V2, ..., Vn])
. Siento que debería poder hacer esto usando elreduceByKey
funcionar con algo del sabor:
My_KMV = My_KV.reduce(lambda a, b: a.append([b]))
El error que obtengo cuando esto ocurre es:
El objeto 'NoneType' no tiene ningún atributo 'append'.
Mis claves son enteros y los valores V1, ..., Vn son tuplas. Mi objetivo es crear un solo par con la clave y una lista de los valores (tuplas).