Hadoop / Hive Collect_list ohne Wiederholung von Elementen
Auf der Grundlage der Post,Hive 0.12 - Collect_list, Ich versuche, Java-Code zu finden, um eine UDAF-Datei zu implementieren, die diese oder ähnliche Funktionen ausführt, aber keine sich wiederholende Sequenz enthält.
Zum Beispiel,collect_all()
gibt eine Sequenz zurückA, A, A, B, B, A, C, C
Ich hätte gerne die SequenzA, B, A, C
ist zurückgekommen. Sequentiell wiederholte Elemente werden entfernt.
Kennt jemand eine Funktion in Hive 0.12, die eine eigene UDAF-Datei erstellt oder geschrieben hat?
Wie immer, danke für die Hilfe.