Java: Calcular o hash SHA-256 de arquivos grandes com eficiência
Eu preciso calcular um hash SHA-256 de um arquivo grande (ou parte dele). Minha implementação funciona bem, mas é muito mais lenta que o cálculo CryptoPP do C ++ (25 Min. Vs. 10 Min para ~ 30GB). O que eu preciso é de um tempo de execução similar em C ++ e Java, então os hashes estão prontos quase ao mesmo tempo. Eu também tentei a implementação do Bouncy Castle, mas isso me deu o mesmo resultado. Aqui está como eu calculo o hash:
int buff = 16384;
try {
RandomAccessFile file = new RandomAccessFile("T:\\someLargeFile.m2v", "r");
long startTime = System.nanoTime();
MessageDigest hashSum = MessageDigest.getInstance("SHA-256");
byte[] buffer = new byte[buff];
byte[] partialHash = null;
long read = 0;
// calculate the hash of the hole file for the test
long offset = file.length();
int unitsize;
while (read < offset) {
unitsize = (int) (((offset - read) >= buff) ? buff : (offset - read));
file.read(buffer, 0, unitsize);
hashSum.update(buffer, 0, unitsize);
read += unitsize;
}
file.close();
partialHash = new byte[hashSum.getDigestLength()];
partialHash = hashSum.digest();
long endTime = System.nanoTime();
System.out.println(endTime - startTime);
} catch (FileNotFoundException e) {
e.printStackTrace();
}