Pig Äquivalent zu SQL GREATEST / LEAST?
Ich versuche das Pig-Äquivalent von @ zu finddie SQL FunktionenGREATEST
undLEAST
. Diese Funktionen sind das skalare Äquivalent der aggregierten SQL-FunktionenMAX
undMIN
, beziehungsweise
Im Wesentlichen möchte ich in der Lage sein, so etwas zu sagen:
x = LOAD 'file:///a/b/c.csv' USING PigStorage() AS (a: int, b: int, c: int);
y = FOREACH x GENERATE a AS a: int, b AS b: int, c AS c: int, GREATEST(a, b, c) AS g: int;
Ich weiß, ich könnte Taschen verwenden undMAX
, um dies zu erledigen, aber ich übersetze aus einer anderen Sprache in Pig und diese Implementierung wäre schwierig zu integrieren.
Gibt es einen "Inline" -Ansatz, den ich hier verwenden könnte? Eine von mir übersehene integrierte Funktion oder eine UDF in Piggybank oder DataFu zum Beispiel wäre ideal! Wenn es eine komplett "Inline" -Version gibt, in der Taschen verwendet werden und ich nur nicht daran denke, ist das auch in Ordnung!
Vielen Dank