Обнаружение дубликатов файлов

Question

Mar 21, 2012, 04:51 PM

Обнаружение дубликатов файлов

Я хотел бы обнаружить дубликаты файлов в дереве каталогов. При обнаружении двух идентичных файлов будет сохранен только один из дубликатов, а оставшиеся дубликаты будут удалены для экономии места на диске.

Дубликат означает файлы, имеющие одинаковое содержимое, которые могут отличаться по именам файлов и пути.

Я думал об использовании алгоритмов хеширования для этой цели, но есть вероятность, что разные файлы имеют одинаковые хеши, поэтому мне нужен какой-то дополнительный механизм, чтобы сказать мне, что файлы не совпадают, даже если хэши одинаковы, потому что я не не хочу удалять два разных файла.

Какой дополнительный быстрый и надежный механизм вы бы использовали?

Обнаружение дубликатов файлов

Ответы на вопрос(7)

Ваш ответ на вопрос

Популярные вопросы

Вы очень активны! Это здорово!

Обнаружение дубликатов файлов

Ответы на вопрос(7)

Ваш ответ на вопрос

Популярные вопросы