Hadoop / Hive Collect_list sem repetir itens
Com base na postagem,Hive 0.12 - Lista de Coletas, Estou tentando localizar o código Java para implementar um UDAF que realize essa funcionalidade ou semelhante, mas sem uma sequência repetida.
Por exemplo,collect_all()
retorna uma sequênciaA, A, A, B, B, A, C, C
Eu gostaria de ter a sequênciaA, B, A, C
devolvida. Os itens repetidos sequencialmente seriam removidos.
Alguém sabe de uma função no Hive 0.12 que realizará ou escreveu seu próprio UDAF?
Como sempre, obrigado pela ajuda.