Skrypt wykrywający powtarzające się pliki graficzne jpg

Autor podstrony: Krzysztof Zajączkowski

Stronę tą wyświetlono już: 3122 razy

Z potrzeby powstał mały program do wykrywania w podanej lokalizacji powtarzających się plików *.jpg. Porównywanie odbywa się dwuetapowo:

Program automatycznie tworzy listę plików powtarzających się, zapisuje ją do pliku files.txt oraz usuwa te pliki.

Uwaga! Program pozostawia na dysku pierwszy napotkany plik co może skutkować utratą danych zawartych w nazwie jakiegoś pliku.

Złożoność obliczeniowa algorytmu jest rzędu (n-1)2·0,5 z tego też powodu algorytm jest czasochłonny, zwłaszcza przy dużej liczbie porównywanych plików. Porównywanie pierwszoetapowe pod względem rozmiaru pliku umożliwia drastyczne skrócenie czasu porównywania. W drugim etapie program wczytuje bitmapy skaluje do tych samych rozmiarów i porównuj bit po bicie. Usuwanie plików odbywa się na samym końcu.

Propozycje książek

Załączniki:

Kod skryptu na GitHub-ie