Wie lautet der Algorithmus zum Berechnen des Amazon-S3-Tags für eine Datei mit mehr als 5 GB?
Auf Amazon S3 hochgeladene Dateien, die kleiner als 5 GB sind, haben ein ETag, das einfach der MD5-Hash der Datei ist. Auf diese Weise können Sie auf einfache Weise überprüfen, ob Ihre lokalen Dateien mit denen in S3 übereinstimmen.
Wenn Ihre Datei jedoch größer als 5 GB ist, berechnet Amazon das ETag anders.
Zum Beispiel habe ich einen mehrteiligen Upload einer 5.970.150.664-Byte-Datei in 380 Teilen durchgeführt. Nun zeigt S3, dass es einen ETag von hat6bcf86bed8807b8e78f0fc6e0a53079d-380
. Meine lokale Datei hat einen MD5-Hash von702242d3703818ddefe6bf7da2bed757
. Ich denke, die Zahl nach dem Bindestrich ist die Anzahl der Teile im mehrteiligen Upload.
Ich vermute auch, dass das neue ETag (vor dem Bindestrich) immer noch ein MD5-Hash ist, aber mit einigen Metadaten, die auf dem Weg vom mehrteiligen Upload enthalten sind.
Kann jemand das ETag unter Verwendung des gleichen Algorithmus wie Amazon S3 berechnen?