25. November 2022 von Axel Ziegler
#4 – Bildverschlagwortung und Bildtaxonomie
In einer Bildagentur beschrieb ein naiver Sachbearbeiter das folgende Bild folgendermaßen: „Junger Mann liefert Pizzen aus.“ Damit ist garantiert, dass dieses Motiv ohne Hilfestellung der Agentur wohl niemals von einer Käuferin oder einem Käufer gefunden werden wird.
Aber warum? Wie kann man es besser machen? In diesem Blog-Beitrag möchte ich auf einige grundlegende Vorgehensweisen bei der Verschlagwortung von Assets, sei es in einem Digital-Asset-Management-System (DAM) oder in anderen Systemen, in denen Daten und Assets gespeichert werden, eingehen.
Eine potenzielle Käuferin suchte also einige Wochen später ein Bild mit einem Pizzalieferanten. So fütterte sie die Suchmaschine der Agentur intuitiv mit den Schlagworten „Lieferant“, „Pizza“, „Bote“, „Pizzabote“ und „Pizzataxi“. Sie fand verständlicherweise nichts. Sie kontaktierte die Agentur und der dortige Bildredakteur erinnerte sich: In irgendeinem der Kataloge der Agentur war ein solcher Auslieferungsfahrer abgebildet. Doch in welchem? Ohne das persönliche Wissen dieses speziellen Redakteurs wäre die Suche ohne Ergebnis geblieben und das Bild wäre im Nirwana der Agenturbilddatenbank verschwunden. Dies wäre übrigens spätestens dann der Fall gewesen, wenn dieser Redakteur die Agentur verlassen hätte.
Klasse statt Masse
An diesem einfachen Beispiel erkennt man, dass die Verschlagwortung ein wesentlicher Bestandteil der Medienverwaltung ist. Nicht nur im Agenturumfeld, sondern auch für Unternehmen, die Bilder, Videos und Dokumente verwalten. In meinem Blog-Beitrag zum DAM-Reifegradmodell ist die Verschlagwortung eine der Kernkomponenten für die Kompetenz eines Unternehmens bei der Medienverwaltung. Es ist nicht entscheidend, wie viele Stichworte einem Motiv zugeordnet werden. Das spätere Finden hängt davon ab, ob die richtigen Keywords, die genau zu diesem einen Motiv passen, gewählt wurden. Das A und O sollte daher Qualität und nicht Quantität sein.
Aus diesem Grund macht es auch keinen Sinn, im Lastenheft von Redakteurinnen und Redakteuren eine Mindest-Keyword-Anzahl pro Motiv anzusetzen – schon gar nicht im zweistelligen Bereich. Erstens wird dadurch die Datenbank nur mit überflüssigen Datenmengen gefüllt und zweitens wird die Beschreibung zwangsläufig oberflächlich und führt zu mangelhaften und frustrierenden Suchergebnissen. Die Tugend liegt in der Mitte, meinte schon Aristoteles. Denn das Gegenteil ist genauso wenig effektiv: Auch zu wenige und zu großflächige und allgemeine Schlagworte helfen der oder dem Suchenden nicht. Bilder, die nicht verschlagwortet wurden, sind für Unternehmen sogar wertlos. Die Produktion des Bildes hat Kosten erzeugt, aber es nach einiger Zeit wieder in einem Datenbestand zu finden, ist schwierig und produziert wiederum Recherchekosten, da man nach keinen sinnvollen Begriffen recherchieren kann. Die Chance, das richtige Bild zu finden, geht somit gegen null. Das betrifft vor allem große und umfangreiche Bildbestände, die dann mit ihrer Masse erschlagen.
Auch Soft Skills sind entscheidend
Auch wenn die Wiederholung trivial klingt: Das Ziel muss es sein, den Kundinnen und Kunden eine effektive und schnelle Suche im umfassenden und breiten Datenbankbestand zu ermöglichen. Um dieses zu gewährleisten, gilt es einige Grundregeln aufzustellen.
Sicherlich, so unterschiedlich, wie die Menschen sind, so unterschiedlich reagieren sie auch auf Bilder. Jede und jeder empfindet etwas anderes, wenn sie oder er ein Motiv betrachtet, und entsprechend unterschiedlich würde auch die Bildbeschreibung ausfallen. Da es bei der Verschlagwortung aber nicht um den subjektiven Eindruck der Redakteurin oder des Redakteurs geht, sondern es sich um eine professionelle Arbeit handelt, sollten alle Mitarbeitenden ein Feingefühl für Bilder besitzen und sich der verantwortungsvollen Aufgabe bewusst sein, ein Bild auffindbar, kauf- und verwendbar zu machen.
Das gilt für Agenturen genauso wie für produzierende, vertreibende oder handelnde Unternehmen. Die angemessene und recherchierbare Verschlagwortung von Produktbildern hilft zum einen den Mitarbeitenden, aber auch den Endkundinnen und -kunden, das richtige Produkt(-Bild) zu finden, es weiterzuverwenden oder zu kaufen. Denn der erste Eindruck von einem Produkt ist meist das Produktbild und nicht die Produktbeschreibung.
XMP/IPTC- und EXIF-Verschlagwortungsstandard
Die meisten Digital-Asset-Management-Systeme bieten sogenannte Metadatenfelder, in denen man Informationen zu dem Bild oder allgemein Media Content hinterlegen kann. Als Metadaten bezeichnet man Daten und Informationen, die andere Daten beschreiben. Metadatenfelder können in den unterschiedlichen Systemen verschieden abgebildet werden. DAM-Systeme halten sich bei Bildern grundsätzlich an zwei Verschlagwortungsstandards: den XMP/IPTC-IIM- und den EXIF-Standard. Bei beiden Standards werden die Informationen direkt in den Datei-Header der entsprechenden Datei geschrieben, soweit das Dateiformat dieses zulässt.
Abweichend von Bildern gibt es auch für Dokumente, Videos und Musik-Dateien Datei-Header, in denen man Informationen hinterlegen kann. Ansonsten würde man auf seinem Smartphone nicht die Interpretin oder den Interpreten, den Titel, das Genre und das Album des Lieblingsliedes sehen, wenn man es abspielt.
Der EXIF-Standard (Exchangeable Image File Format) wird durch die Kamera geschrieben, mit der das Foto gemacht wurde. In dem EXIF-Header werden Informationen zum Kamera-Modell, zur Orientierung, Belichtungsdauer oder Blende gespeichert. Dies sind Daten, die man üblicherweise nicht verändern sollte und die einen informativen Charakter haben.
Der IPTC-IIM-Standard (International Press Telecommunications Council / Information Interchange Model) wird kurz als IPTC-Standard bezeichnet. Die Speicherung dieses Standards erfolgt seit 2003 im XMP-Format, weshalb man auch teilweise vom XMP/IPTC-Header spricht.
Im XMP/IPTC-Header werden weniger technische Informationen gespeichert, dazu zählen Metadaten wie Überschrift, Beschreibung, Stichworte, Stadt, Bundesland/Kanton, Land, Copyright usw. Wenn ihr mit Adobe Photoshop oder InDesign arbeitet, kennt ihr vielleicht das Menü unter Datei/Dateieigenschaften, in dem ihr diese Metadatenfelder vorausfüllen könnt:
Adobe speichert diese Informationen dann direkt in dem Header der jeweiligen Datei.
Die wichtigsten Felder sind dabei zunächst einmal folgende:
- Überschrift: In diesem Feld wird ein kurzer Titel des Bildes hinterlegt.
- Beschreibung: In das Feld kann ein Fließtext eingepflegt werden, der das Bild vollständig beschreibt.
- Stichworte: In den Schlagworten, Keywords oder Stichworten können Begriffe gespeichert werden, die weder in der Überschrift noch in der Beschreibung genannt wurden.
- Copyright: Bei wem die Copyright-Rechte liegen, wird in diesem Feld eingetragen. Hier steht meist die Agentur oder die Bilderstellerin beziehungsweise der Bildersteller.
- Lizenzbestimmungen: Welche lizenzrechtlichen Bestimmungen für das Bild gelten, wird in diesem Feld hinterlegt.
Weitere Felder können dann je nach Unternehmen oder Organisation ebenfalls recht wichtig werden. Im XMP/IPTC und im EXIF gibt es kein Metadatenfeld für beispielsweise die Artikelnummer, die SAP-Nummer oder die GTIN (ehemals die EAN-Nummer). Digital-Asset-Management-Systeme bieten von daher häufig die Möglichkeit, dass man kundenindividuelle Metadatenfelder in dem System selbständig anlegen kann, die für die Beschreibung des Bildes in einem Unternehmen oder einer Organisation besonders relevant sind.
Geo-Daten sind Informationen, die eine Zuordnung des Bildes zu einer räumlichen Lage mittels Koordinaten ermöglichen. Diese Informationen werden von der Kamera, soweit diese die Funktion unterstützt, in den eigenen Datei-Header geschrieben. Gerade wenn in dem DAM-System Bilder verwaltet werden, die natur- oder baubezogen sind, könnte dies eine wichtige Information sein.
Wie denn nun genau?
Es gibt einige schlichte Normen, an die man sich bei der Vergabe von Stich- oder Schlagworten halten sollte. Natürlich gibt es je nach Einsatz, Branche und Inhalt Unterschiede. Die nachfolgenden Prinzipien sind daher als grundsätzliche Empfehlungen zu verstehen:
Bei Keywords, Stich- oder Schlagworten handelt es sich, wie der Begriff schon sagt, um einzelne Worte, also nicht um Wortgruppen, sogenannte Phrasen oder ganze Sätze. Ausnahmen bilden nur Eigennamen wie „adesso SE“ oder „New York“.
In dem einführenden Beispiel würde die oder der Suchende nach Begriffen wie „Lieferant“, „Pizza“, „Bote“, „Pizzabote“, „Pizzataxi“ recherchieren. Hierbei handelt es sich um Substantive, die sowohl im Singular (Einzahl) als auch im Plural (Mehrzahl) verwendet werden können. Man sollte berücksichtigen, dass aufgrund der „Reform der deutschen Rechtschreibung von 1996“ unterschiedliche Schreibweisen von Begriffen zulässig sind. Auch regionale Unterschiede bei der Verwendung von Begriffen sind im Auge zu behalten.
Bei Produktbildern sind Gattungsnamen ebenfalls ein zu berücksichtigender Faktor. Im Marketing versteht man darunter, dass sich ein Produkt durch die Marktdurchdringung so positioniert hat, dass der Markenname zum Synonym der Gattung geworden ist. Produktnamen, die zu Gattungsnamen geworden sind, wären unter anderem Tesa für Klebestreifen, Pritt-Stift für einen Klebestift, Zewa für eine Küchenrolle oder Tempo für Papiertaschentücher. Für Marketerinnen und Marketer ist dies ein erstrebenswertes Ziel, doch können Gattungsnamen bei der Verschlagwortung für reichlich Diskussionsstoff sorgen.
Vorteilhaft ist es außerdem, gängige Abkürzungen für Fachbegriffe zu verwenden. Wer weiß schon, was DNS ausgeschrieben heißt? Nach einer Desoxyribonukleinsäure wird wohl weniger gesucht als nach DNS oder der englischen Bezeichnung DNA.
Falls zusätzlich zu Substantiven auch Verben verwendet werden, sollten diese in der Infinitivform verwendet werden. Der Infinitiv ist die Grundform des Verbs und gibt dessen Bedeutung an. Beispiele wären Drehen, Leuchten, Laufen, Pulsieren.
Unterstützung durch Taxonomie
Nachdem beschrieben wurde, was genau inhaltlich auf dem Bild abgebildet ist, sollte nach Möglichkeit eine Kategorisierung stattfinden. Man spricht hierbei auch von der Taxonomie.
Wikipedia bietet eine recht anschauliche Erläuterung zur Taxonomie: „Taxonomien sind hierarchische Klasseneinteilungen eines Themenbereichs. Sie bilden Über- und Unterordnungsbeziehungen ab und können so Vererbungen darstellen. Dabei wird jeder Klasse nur eine Oberklasse zugeordnet, so dass die gesamte Klassifikation eine Baumstruktur abbildet. In dieser Struktur enthalten die der Wurzel nahestehenden Elemente allgemeine Informationen. Mit einer zunehmenden Verzweigung der Taxonomie wird das darin hinterlegte Wissen immer spezifischer.“
Es gibt verschiedene Möglichkeiten, die Begriffe im Rahmen der Taxonomie zu visualisieren: Zunächst muss man zwischen einer Ordner-/Mappen-/Verzeichnisstruktur auf der einen Seite und einer Kategorisierung anhand eines Metadatenfeldes auf der anderen Seite unterscheiden. Ordner beziehungsweise Mappen und Verzeichnisse werden häufig als Synonym verwendet, im Detail unterscheiden sie sich aber in der Form der Datenhaltung und Referenzierung.
Innerhalb von Mappen oder Ordnern liegen lediglich Referenzen eines Assets, während bei Verzeichnissen die Assets direkt im Verzeichnis liegen. Das heißt: Wenn man ein Asset in zwei Ordnern/Mappen hinterlegen möchte, dann hat man nur ein Asset, das in zwei Ordnern referenziert wird. Bei Verzeichnissen hat man zwei unabhängige Dateien – jeweils eine in jedem Verzeichnis. Ändert man bei einer Ordnerstruktur ein Asset, wird auch das Asset in dem anderen Ordner geändert, bei Verzeichnissen wird nur das Asset in dem jeweiligen Verzeichnis geändert, das Asset in dem anderen Verzeichnis bleibt unberührt.
Wird die Taxonomie hingegen in einem Metadatenfeld abgebildet, kann dies folgendermaßen dargestellt werden:
- als einfache flache Liste, aus der man einen Eintrag wählen kann (Pull-down-Menü)
- als flache Liste, aus der man mehrere Einträge wählen kann, also als Checkboxen
- als hierarchische Struktur mit einer Einfachauswahl
- als hierarchische Struktur mit einer Mehrfachauswahl
Grundsätzlich bieten Digital-Asset-Management-Systeme häufig die Möglichkeit, dass die verantwortliche Person die Kategorie- oder Verschlagwortungsbäume und Listen selbständig erstellt. Die oder der für die Applikation verantwortliche Mitarbeitende gibt die Begriffe im System vor, die bei der Verschlagwortung des Assets durch die Redakteurin oder den Redakteur ausgewählt werden dürfen. Das hat den Vorteil, dass man im System ein einheitliches Vokabular und den gleichen Aufbau hat – zum Beispiel Artikelnummern, nach denen man suchen kann. Ansonsten besteht die Gefahr, dass je nach Redakteurin oder Redakteur die gleiche Artikelnummer anders geschrieben wird. Dies würde das Suchergebnis verfälschen.
Gerade Artikelnummern wurden ursprünglich durch ein PLM- (Product Life Cycle Management), PIM- (Product Information Management) oder ERP-System (Enterprise Ressource Planning) gepflegt, da diese für Produktdaten verantwortlich sind. Warum nicht die korrekte Artikelnummer und den Artikelnamen von dort abholen? Diese Systeme bieten Schnittstellen (APIs), an denen ein Digital-Asset-Management-System eine Anfrage stellen kann. Somit müssen die Produktdaten nur dort gepflegt werden. Das DAM-System holt sich die Informationen einfach ab.
Im Internet werden außerdem verschiedene themenspezifische Verschlagwortungskataloge zur Verfügung gestellt, die man über Schnittstellen ansprechen kann – man spricht hierbei von Normdaten. Über diese zentralen Verschlagwortungskataloge werden brancheneinheitliche Terminologien und Begriffe gepflegt, so dass man sie nicht selber pflegen muss. Die Deutsche Nationalbibliothek bietet über die Gemeinsame Normdatei (GND) zum Beispiel den Normdaten-Katalog „DANTE“ an („Datendrehscheibe für Normdaten und Terminologien“). DAM-Systeme können sich mit dieser Normdatenbank verbinden und die dortigen Taxonomien verwenden.
Nicht auf die leichte Schulter nehmen
Die Verschlagwortung und Beschreibung von Assets ist ein ganz wesentlicher Bestandteil der Medienverwaltung. Sie sollte nicht vernachlässigt werden. Um eine den Mitarbeitenden sowie den Kundinnen und Kunden gerecht werdende Verschlagwortungsarbeit zu garantieren, die ja auch immer mit Rechercheaufwand verbunden ist, ist entsprechend Zeit einzuplanen. Diese Zeit sollte man sich nehmen: Denn nur gefundene Bilder sind verkaufte und verwendete Bilder.
In unseren Projekten ist es von daher wichtig, sich im Vorfeld darüber Gedanken zu machen, welche Metadatenfelder die Kundin oder der Kunde benötigt, mit welchen Inhalten sie befüllt werden sollen, welche grammatische Form man verwenden möchte und wie die Kategorisierung und/oder Taxonomie aussieht.