Hadoop / Hive Collect_list ohne Wiederholung von Elementen

Auf der Grundlage der Post,Hive 0.12 - Collect_list, Ich versuche, Java-Code zu finden, um eine UDAF-Datei zu implementieren, die diese oder ähnliche Funktionen ausführt, aber keine sich wiederholende Sequenz enthält.

Zum Beispiel,collect_all() gibt eine Sequenz zurückA, A, A, B, B, A, C, C Ich hätte gerne die SequenzA, B, A, C ist zurückgekommen. Sequentiell wiederholte Elemente werden entfernt.

Kennt jemand eine Funktion in Hive 0.12, die eine eigene UDAF-Datei erstellt oder geschrieben hat?

Wie immer, danke für die Hilfe.

Antworten auf die Frage(4)

Ihre Antwort auf die Frage