Lesen Sie die zuletzt aktualisierte Datei in HDFS

Ich möchte die neueste aktualisierte Datei aus einem meiner HDFS-Verzeichnisse. Der Code sollte im Grunde genommen die Verzeichnisse und Unterverzeichnisse durchlaufen und den neuesten Dateipfad mit dem Dateinamen abrufen. Ich konnte die neueste Datei im lokalen Dateisystem abrufen, war mir jedoch nicht sicher, wie ich sie für HDFS eins ausführen soll.

find /tmp/sdsa -type f -print0 | xargs -0 stat --format '%Y :%y %n' | sort -nr | cut -d: -f2- | head

Der obige Code funktioniert für das lokale Dateisystem. Ich kann Datum, Uhrzeit und Dateinamen von HDFS abrufen, aber wie erhalte ich die neueste Datei mit diesen drei Parametern?

dies ist der Code, den ich ausprobiert habe:

hadoop fs -ls -R /tmp/apps | awk -F" " '{print $6" "$7" "$8}'

Jede Hilfe wird geschätzt.

Danke im Voraus

Antworten auf die Frage(4)

Ihre Antwort auf die Frage