Hadoop / Hive Collect_list sin repetir elementos
Según la publicación,Colmena 0.12 - Collect_list, Estoy tratando de ubicar el código Java para implementar un UDAF que logre esta funcionalidad u otra similar pero sin una secuencia repetitiva.
Por ejemplo,collect_all()
devuelve una secuenciaA, A, A, B, B, A, C, C
Me gustaria tener la secuenciaA, B, A, C
devuelto Los elementos repetidos secuencialmente se eliminarían.
¿Alguien sabe de una función en Hive 0.12 que logrará o ha escrito su propio UDAF?
Como siempre, gracias por la ayuda.