Шукати в цьому блозі

неділю, 21 травня 2023 р.

Пошук по md5, в консолі Linux однакових файлів з різними іменами.

Для пошуку продубльованих файлів з різними іменами,  у консолі Linux, достатньо дати в каталозі пошуку команду:

find -name '*.pdf' -print0 | xargs -0 md5sum | sort | uniq -Dw 32
де:
find -name '*.pdf' -print0 - знаходить усі pdf файли у піддереві, починаючи з поточного каталогу,
друкуючи назви, що розділені NUL
xargs -0 md5sum - читає список, розділений NUL, і обчислює контрольну суму md5 для кожного файлу.
sort  - сортування, упорядковуючи записи в певному порядку.
uniq -Dw 32 - порівнює перші 32 символи відсортованих рядків і друкує лише ті, що мають однаковий хеш.