¿Qué algoritmo de suma de verificación debo usar?

Estoy construyendo un sistema que necesita poder encontrar siblobs de bytes han sido actualizados. En lugar de almacenar todo el blob (pueden tener hasta 5 MB), creo que debería calcular una suma de comprobación, almacenar esto y calcular la misma suma de comprobación un poco más tarde, para ver si el blog se ha actualizado.

El objetivo es minimizar lo siguiente (en ese orden):

tamaño de la suma de controltiempo para calcularprobabilidad de colisiones (2 sumas de verificación idénticas ocurren incluso si el contenido ha sido modificado).

Es aceptable que nuestro sistema tenga colisión no más de 1 / 1,000,000. La preocupación no es la seguridad, sino simplemente la detección de actualizaciones / errores, por lo que las colisiones raras están bien. (Es por eso que lo puse al final en las cosas para minimizar).

Además, no podemos modificar los blobs de texto nosotros mismos.

Por supuesto,md5, crc osha1 me viene a la mente, y si quisiera una solución rápida, la buscaría. Sin embargo, más que una solución rápida, estoy buscando lo que podría serUna comparación de diferentes métodos, así como los pros y los contras.

Respuestas a la pregunta(2)

Su respuesta a la pregunta