Arbeiten mit dem Hashwert

Was ist ein Hashwert oder weshalb sind Bildmuster leistungsfähiger?

Ein Hashwert ist vergleichbar mit einem Fingerabdruck - nur eben für eine Datei, nicht für einen Finger. Das bedeutet, der Hashwert ist eine eindeutige Zeichenfolge, die aus dem Inhalt einer Datei berechnet wird. Daraus resultiert, dass eine Veränderung an einer Datei ebenfalls eine Veränderung des Hashwerts zur Folge hat.
Wird beispielsweise nur die Schriftfarbe in einem Textdokument geändert, so ist der Hashwert komplett anders - obwohl der Inhalt derselbe geblieben ist. Doch genau das ist der Sinn eines Hashwerts: ein Element zu 100% zu identifizieren.

Übertragen auf Bild-Elemente kann man sagen, es gibt nahezu unendlich viele Möglichkeiten, verschiedene Hashwerte für ein einzelnes Bild-Element zu erzeugen.

Beispiel

Hashwert-Vergleich

Veränderungen Hash-Werte
Originalbild (jpg) 98379517f2a00168b8a01e07eed555c7
Bild-Element-Größe und Verpixelung 5e976834d56c973bb459d46a17950f7d
Schwarzer Balken e396cba745e82fc2ae20f048c2e18727
Horizontaler Flip 0aed6c4e73ef35b09c10df24aac6d686
Helligkeit / Kontrast 3a17a30e85d015ed53a987aae7bcc821
Vertikaler Flip /
Schwarz-Weiß
2587fcc1647b402302f0b5c4ce7a4b34

 

Mit einem Hash-Vergleich würde keines der 5 bearbeiteten Bild-Elemente erkannt werden.
DoublePics hat jedoch durch seinen Bildmusterprozessor bei jedem dieser Bild-Elemente - abhängig von den verwendeten Suchparametern - ein "Match" zum Orginal-Bild-Element gefunden. Schließlich ist der Inhalt (nämlich das Bild-Element selbst), auf den es letzten Endes ankommt, immer noch derselbe..