Для пошуку продубльованих файлів з різними іменами, у консолі Linux, достатньо дати в каталозі пошуку команду:
find -name '*.pdf' -print0 | xargs -0 md5sum | sort | uniq -Dw 32
де:
find -name '*.pdf' -print0
- знаходить усі pdf файли у піддереві, починаючи з поточного каталогу,
друкуючи назви, що розділені NUL
xargs -0 md5sum -
читає список, розділений NUL, і обчислює контрольну суму md5 для кожного файлу.
sort
- сортування, упорядковуючи записи в певному порядку.
uniq -Dw 32
- порівнює перші 32 символи відсортованих рядків і друкує лише ті, що мають однаковий хеш.
Немає коментарів:
Дописати коментар