Dup Detector: nutnost pro nepořádníky

Dup Detector: nutnost pro nepořádníky

Šikovný freewarový nástroj se postará o vyhledání a eliminaci duplikátů mezi vašimi obrázky a digitálně pořízenými fotografiemi. A protože obrázky analyzuje pixel po pixelu, nedá se jen tak ošálit.

Pokud máte v počítači či na nosičích uskladněné velké kolekce obrázků, často je přesouváte, kopírujete, přejmenováváte či lehce upravujete v grafických editorech, program podobného ražení se vám bude dozajista hodit. Když za něj navíc nemusíte nic platit, není co řešit. Dup Detector si můžete stáhnout z webu www.prismaticsoftware.com.

Hledání duplikátů pomocí tohoto programu je založeno na analýze jednotlivých pixelů. Veškeré získané informace si program ukládá do vlastní databáze, v jejímž rámci pak dochází k porovnávání dat. Postup práce je tedy následující: výběr souborů či adresářů, vytvoření pracovního databázového souboru, analýza, zobrazení potenciálních duplikátů, odstranění. Jednotlivé kroky se vždy dají modifikovat, což je nejvíce patrné u analýzy. Správné nastavení jejích parametrů je totiž klíčové - snadno zjistíte, že nevhodné změny mohou vést jak k absurdním výsledkům (500 párů duplikátů mezi 150 obrázky), tak k lakonickému tvrzení, že nebyly žádné shodné obrázky nalezeny – a to i v případě, že jste schválně vytvořili testovací skupinu shodných či velmi příbuzných dvojic. Platí tedy, že je vhodné pohrát si s nastavením a nespokojit se s prvními výsledky. Program naštěstí s podobným experimentováním počítá a je tedy snadné.

Pokračování 2 / 2

Praxe: jak na duplikáty

1) Rozhraní programu nabízí přehledné uspořádání na principu záložek. Při běžném postupu prací využijete každou z nich. Záložka Method nabízí volbu mezi systémem zpracování souborů a následným porovnáváním. První možnost (Compare All Images...) nabízí zpracování jednoho adresáře nebo seznamu libovolných souborů. Druhá možnost (Compare Images...) nabízí vytvoření dvou databází a jejich vzájemné porovnání (například dva adresáře proti sobě). Konečně třetí možnost (Compare Single...) umožňuje vyhledat duplikát konkrétního obrázku v určitém adresáři nebo kolekci. V tomto ukázkovém případě je vybrána první možnost.


Hlavní okno programu s výběrem primárního postupu porovnávání

2) Záložka Get Data nabízí vytvoření databáze informací o obrázcích, dostupné jsou pouze položky odpovídající volbě v předchozím kroku. Tlačítko Open slouží k otevření dříve vytvořené a posléze uložené databáze (File / Save As...), tlačítko Build k jejímu vytvoření.


Záložka Get Data slouží k vytvoření databáze informací o obrázcích

3) Dialog vytvoření databáze nabízí buď zpracování konkrétního adresáře (rozbalovací menu Read Image Files From Folder) nebo vytvoření vlastního seznamu (Image List tamtéž). Ponechejte výběr adresáře, kliknutím na Browse jej lokalizujte. Pokud obsahuje další vnořené adresáře a i ty mají být zahrnuty do prohledávání, zatrhněte Include All Subfolders. Kliknutím na OK se program vrátí do hlavního dialogu a začne zpracovávat databázi. Tento proces ovšem může být značně časově náročný a pokud zadáte řádově tisíce fotografií, může trvat až několik hodin.


Záložka Get Data slouží k vytvoření databáze informací o obrázcích

4) Po zpracování databáze se zobrazí třetí záložka v pořadí, Find Dups. Právě zde se ovlivňuje nastavení a vyhledávají duplikáty. Po kliknutí na tlačítko Find Dups se ve spodní části zobrazí textová informace o počtu odpovídajících dvojic obrázků. Pokud ovšem v nastavení programu je povoleno automatické zobrazení duplikátů na záložce View Dups (Options / Show View Dups), tak se této informace nedočkáte. Dup if Within je procentuální nastavení mantinelů shodnosti obrázků. Čím menší je rozmezí, tím více shodných prvků musí mít takové obrázky, které jsou označené jako duplikáty. Vyplatí se experimentovat.


Vyhledání duplikátů

5) V testovací kolekci obrázků jsou tři duplikáty: jeden pouze na základě přejmenování souboru, další obrázek je totožný, pouze v jiném rozlišení, konečně třetí je černobílá varianta původní grafiky. Při prvním vyhledání Dup Detector našel dva páry duplikátů, nenašel černobílou variantu a nabídl 5 párů obrázků, které duplikáty nejsou. Mezi nabízenými dvojicemi obrázků se posouváte pomocí tlačítek Back a Next. Pod každým obrázkem je tlačítko Delete, které umožní přímo smazat vybraný soubor.


Není duplikát jako duplikát, ale tohle skutečně není dobře

6) Klikněte zpět na záložku Find Dups, protože je nutné modifikovat parametry hledání. Kliknutím na tlačítko Setup se zobrazí důležitý dialog nastavení. Volby Color (Euclidean) a Color (Weighted Euclidean) nabízejí prakticky toužené výsledky, ovšem často zahrnují množství chybných výsledků. Lepší je proto Color (Variance), společně s touto volbou vybrat kontrolu zrcadlového převrácení (Check for Mirrored...) a následně se pojistit proti černobílým variantám (Use Luminance...). Rozlišení obrázků se věnuje část Match Restriction, pokud chcete hledat bez ohledu na rozlišení, zvolte první možnost.


Nastavení, které poskytovalo velmi dobré a spolehlivé výsledky

7) Po opětovném nastavení vyhledal program správně všechny tři duplicitní páry, bez ohledu na výše zmíněné změny v obrázcích. Navíc nabídl i jeden další pár, kde byly sice dva různé obrázky, ale jen velmi málo rozdílné – šlo o nepatrně posunuté výřezy z téhož zdrojového obrázku. I to lze brát v určitém případě jako duplikát. Kliknutím na tlačítko Delete odstraníte ty, které skutečně považujete za duplikáty.


Nové analyzování poskytlo velmi dobré výsledky

8) Kromě popsaného a víceméně manuálního vyhledávání nabízí program i plně či částečně automatické odstraňování duplikátů (Options / Semi-auto Delete a Automatic Delete). K využití této možnosti je ale vhodné přistoupit pouze tehdy, když si pojistíte to, že odstraněné soubory nebudou nenávratně pryč: toho lze dosáhnout například nastavením přesunu obrázků místo jejich odstranění (Options / Move Instead of Delete). Dup Detecotor nabízí ještě řadu zajímavých nastavení spojených s ovládáním programu, tříděním a zobrazováním výsledků, vše stojí za vyzkoušení.


Nastavení základního chování programu pomocí nabídky Options

Výsledné hodnocení? Velmi dobrý program, který nabízí spolehlivé výsledky v případě, že si porozumíte s nastavením a budete vědět co a jak použít. Je trochu těžkopádný při analyzování většího počtu fotografií ve větším rozlišení, naopak velmi dobré je zobrazení výsledků a odstraňování duplikátů. Dobrý pomocník.

 

 

 

 

 

 

 

 

 

 


 

Určitě si přečtěte

Články odjinud