Digital-Asset-Management mit XMP

http://www.contentmanager.de/magazin/artikel_1926_digital_asset_management_xmp.html

"Ein Bild sagt mehr als tausend Worte" Wer kennt diesen Ausspruch wohl nicht? Bilder erklären, verdeutlichen und erzeugen Stimmungen. Kein Wunder, dass sowohl die Werbebranche als auch alle modernen Medien reichlich davon Gebrauch machen. Verlage und Marketingagenturen als auch Unternehmen stehen vor der Aufgabe mit einer rapide wachsenden Anzahl von Bildern umzugehen. Ein Blick auf die Kosten verdeutlicht dabei schnell, dass wohl kaum ein Unternehmen an der Erschließung und Verwaltung seiner Bilddatenbestände vorbei kommt.

In diesem Artikel soll exemplarisch anhand einer auf dem Content Management System eZ Publish basierenden Lösung für den Verlag Sanoma gezeigt werden, wie große Bilddatenbestände effizient erschlossen und insbesondere in Hinblick auf eine Wiederverwendung des Materials Kosten eingespart werden können. In Hinblick auf eine standardisiertes Metadatenmodell wurde dabei auf XMP gesetzt. "Die Extensible Metadata Platform (XMP) ist ein Standard um Metadaten, also bei einem Foto beispielsweise Daten über den Fotografen, die verwendete Ausrüstung und den Aufnahmeort, in digitale Medien einzubetten. Sie wurde von Adobe im Jahr 2001 veröffentlicht und erstmals in den Acrobat Reader 5 integriert. [Quelle: wikipedia.de]" (siehe auch http://www.adobe.com/...)


Die Aufgabe

Sanoma ist ein europaweit tätiges Verlagshaus. Ein wesentlicher Geschäftsbereich sind dabei Lehrbücher und elektronische Lerninhalte, die durch weitestgehend unabhängige Töchter in verschiedenen Ländern Europas produziert werden. Obwohl die Publikationen sich natürlich in der jeweiligen Sprache und auch in ihrem Inhalt stark unterscheiden, so weisen sie auch ein Potential für die Wiederverwendung aus. Richtig: Die Bilder. Es war also zunächst das Ziel in einem ersten Schritt eine zentrale Bild- und Publikationsdatenbank aufzubauen, die die Wiederverwendung und damit die gemeinsame Nutzung bestmöglich unterstützt. Dazu Bernard de Groot (Chief Innovation Officer der Sanoma Learning & Literature Division und der Initiator der neuen Plattform): "Ein Afrikanischer Elefant in einem polnischen Biologiebuch ist letztlich derselbe wie in einem niederländischen. Die Grafik einer Molekülstruktur in einem finnischen Chemiebuch ist dieselbe wie in einem belgischen Chemiebuch". "Und wenn wir einmal eine Stadtansicht von London haben fotografieren lassen – warum sollten wir sie nicht mehrfach verwenden?"

Anfang 2007 startete dann die Phase der Grobspezifikation, die insbesondere Fragen bzgl. der verwendeten Standards und notwendiger Schnittstellen klären sollte. Dabei war einerseits zu klären wie das bereits heute vorliegende Bildmaterial - einige hunderttausend Bilder in unterschiedlichsten Bildformaten (JPEG, TIFF, etc.) - importiert und hinsichtlich der Recherche wieder auffindbar gemacht werden sollte. Dabei sollten neben den typischen Merkmalen wie Schlagworte, Autor und Bildformate insbesondere auch Metadaten hinsichtlich der Eigentumsrechte und der Lizenz zusammen mit den Bildern verwaltet werden. Um zu verhindern, dass diese Informationen im Verarbeitungsprozess verloren gehen musste sichergestellt werden, dass diese Daten direkt in das Bildmaterial eingebunden werden. Eine weitere Anforderung bestand hinsichtlich der Erweiterbarkeit der Merkmale. Eine Anforderung, die durchaus zu Recht erhoben wurde wenn man bedenkt, dass neben der Entwicklung zeitgleich Themen wie Rechtemanagement und die damit verbundenen Geschäftsprozesse diskutiert und verabschiedet werden mussten. Die Festlegung auf ein vordefiniertes Merkmalset hätte das Projekt von vornherein zum Scheitern verurteilt.

Neben diesen Anforderungen aus Anwendersicht spielte natürlich auch die Tool-Unterstützung eine wesentliche Rolle. So sollten die Metadaten sowohl in Adobe Indesign als auch in Bildeditoren wie z.B. Adobe Photoshop unterstützt werden.


Die Lösung: XMP

XMP basiert auf offenen Standards und bettet die vom World Wide Web Consortium veröffentlichte formale Sprache RDF (Resource Description Framework) in Binärdaten ein. Inbesondere hinsichtlich Erweiterbarkeit – Basis ist auch hier XML – ist XMP dabei Standards wie z.B. IPTCNAA und Exif überlegen beziehungsweise integriert diese. Durch die Verwendung eigener Namespaces ist es mit XMP möglich eigene Knoten oder Kategorien auszubilden ohne das eine Anwendung hiervon unmittelbar betroffen ist. So kann beispielsweise der spezielle Informationsbedarf eines angeschlossenen Verlagshauses, der zum Beispiel im Produktions- oder Abrechnungsprozess genutzt wird, leicht in den Metadatenbestand integriert werden ohne das andere Anwendungen hiervon betroffen wären. Durch die (mittlerweile) vollständige Unterstützung der Adobe Produktpalette steht zudem ein entsprechendes Toolset für die nahtlose Weiterverarbeitung zur Verfügung. Interessant hierbei ist nicht nur die Verwaltung der Metadaten innerhalb der Bilder sondern auch die Wiedererkennung einmal erfasster Bilddaten im Endprodukt, wie einem hochauflösenden PDF-Dokument.

Eine Schwierigkeit zeigte sich allerdings bezüglich des Imports der bestehenden Bilder. Der weitaus größte Anteil verfügte nicht über eine entsprechende Auszeichnung. Die Metadaten mussten also beim Import mit den entsprechenden Daten angereichert werden. Aufgrund der unterschiedlichen Quellen wurde daher vereinbart, dass die XMP-Metadaten auch in externen Dateien oder auch quasi "konvertiert" in Form von CSV-Dateien geliefert werden konnten. Somit war sichergestellt, dass angefangen von bestehenden Bilddatenbanken, über Dateisystem bis zur Desktop-Ablage alle bestehende Bilddatenbestände sinnvoll ausgezeichnet werden konnten.


Die Umsetzung mit eZ Publish

Die Umsetzung des Systems auf der Basis des Enterprise Open Source Content Management Systems eZ Publish erfolgte in einem Zeitraum von drei Monaten. Im Vordergrund stand dabei die Erstellung und Anpassung von Templates für den Seitenaufbau, die Erstellung zusätzliche Import-Schnittstellen sowie die Unterstützung des internationalen Projektteams bei der Definition der gemeinsamen genutzten Metadaten. Da eZ Publish als CMS von vornherein über die wesentlichen Funktionalitäten bezüglich der Verwaltung von digitalen Inhalte verfügt mussten lediglich die notwendige Klassenstruktur als auch der erweitertete Suchindex auf der Basis von eZ Find definiert und konfiguriert werden.

Eine spezielle Erweiterung/Extension für die Behandlung der XMPMetadaten erlaubt schließlich die freie Definition der XMP Strukturen. Diese Erweiterung war notwendig, um innerhalb der bereits von eZ Publish unterstützten dynamischen Klassenstrukturen auf eine Überarbeitung des Klassenmodells bei sich ändernden Metadatenstrukturen verzichten zu können. Man kann sich das etwa so vorstellen als wollte man eine Klasse "Buch" implementieren. Ist wohl den meisten Büchern noch gemeinsam, dass Sie einen Preis, eine ISBN-Nummer und auch einen Autor haben, so ist das Inhaltsverzeichnis – wenn auch strukturiert kaum in vordefinierten Attributen abbildbar. Ähnlich verhält es sich mit den Metadaten im XMP Format.

Das Frontend für die Suche orientiert sich dabei an Altbekanntem wie Google oder der professionellen Bilddatenbank Alamy, um den Schulungs- und Einarbeitungsaufwand zu reduzieren. Erweiterte Suchmerkmale, Wildcard/Platzhalter oder auch die Sortierung und Relevanzanzeige unterstützen dabei bei der Suche in dem vorhandenen Bildmaterial.



Detailansicht


Einzelne Bilder können in der Einzelbildanzeige angezeigt werden. Hier wird neben dem Merkmalsset, dass in entsprechend Kategorien gruppiert angezeigt wird, auch das eigentliche Bild in einem automatisch erzeugten Vorschauformat dargestellt.



Detailansicht


Darüber hinaus kann mit einem Click auf den Edit-Button - die entsprechenden Rechte vorausgesetzt - in den Editiermodus gewechselt werden. Dabei wird nicht das eigentliche Bild sondern die Metadaten editiert. Zudem können zu einem Bild weitere Dateien in anderen Bildformaten – letztlich eine andere Ausprägung desselben Assets – oder auch Verknüpfungen zu anderen Assets hergestellt werden. Welche Merkmale editierbar sind wurde in eZ Publish durch einen eigenen Datentyp implementiert, der wiederum Zugriff auf die in XMP gespeicherten Informationen hat.



Detailansicht



Besonderheit - Procurement-Konzept

Eine besondere Bedeutung lag bei der Implementierung von Sanoma auf dem Procurement-Konzept. Letztlich musste durch geeignete Workflows sichergestellt werden, dass genau Buch darüber geführt wird wer, wann, welches Bild in welchem Format heruntergeladen hat. Beim Herunterladen werden dabei sämtliche Metadaten inklusive einiger systeminterner Verwaltungsinformationen in die bestehende XMP Metadatenstruktur der Bilder eingebettet beziehungsweise eine solche Struktur angelegt. Bei der Weiterverarbeitung mit z.B. Photoshop können diese Daten dann ebenfalls innerhalb von Photoshop angezeigt und bearbeitet werden. Hier liegt allerdings auch eine Problem, dass sich derzeit nur über entsprechende Verfahrensanweisungen lösen lässt.

Zum einen können Metadaten natürlich verändert werden. Dies kann bei einem erneuten Import des Bildes dazu führen, dass die Verwaltungsinformationen nicht mehr erkannt werden weil sie zum Beispiel mittels Photoshop gelöscht wurden. Andererseits können durch Cut und Paste Operationen – also dem Ausschneiden, Duplizieren und erneutem Abspeichern von Teilbereichen des Bildes – ebenfalls Metadaten verloren gehen. Nach kurzer Einweisung lassen sich diese Probleme allerdings leicht umgehen. Nichtsdestotrotz wäre eine entsprechende Tool Unterstützung durch zum Beispiel Adobe Photoshop in Bezug auf die Rechte zur Änderung dieser Metadaten wünschenswert.


Das Ergebnis

Im Ergebnis lässt sich festhalten, dass Digital-Asset-Management mit XMP vielversprechende Ansätze sowohl für die Verwaltung als auch für die Weiterverarbeitung und den Austausch digitaler Bilderdatenbestände bietet. Durch die Erweiterbarkeit von XMP um eigene Merkmalskategorien können zum Beispiel erweiterte Kategorien bezüglich Lizenz- und Vertragsmanagement als auch einfache Anwendung wie zum Beispiel Schlüsselwörter in mehreren Sprachen sinnvoll implementiert werden. Ebenso wünschenswert ist natürlich die Verlinkung mit anderen Dokumenten wie Lizenzen und Verträge.

Die Implementierung für Sanoma stellt den ersten Schritt hin zu einer Sharing-Plattform dar, die sowohl den Austausch von Bildmaterial, die Zusammenarbeit bei der Produktion als auch die Integration in den Produktions- und Publikationsprozess – hier z.B. interaktive Lerninhalte – zum Ziel hat. Die Komponente Digital Asset Management, auf der Basis von eZ Publish, wird dabei unter Einbeziehung von eZ Systems im Rahmen eines Open Innovation Modells entwickelt, dass in Verbindung mit eZ Publish Premium sicherstellt, dass die sich an der Entwicklung beteiligten Unternehmen frühzeitig von Erweiterungen, die durch die Gesamtheit der Anwender finanziert werden, partizipieren und aktuelle Updates zeitnah erhalten. Die Gesamtkosten einer solchen Lösung auf der Basis des Open Innovation Modells sind dadurch deutlich geringer als vergleichbare Individualentwicklungen.

Die im zweiten Projektschritt unter Einbeziehung mehrerer Anwender von eZ Systems implementierte Collaboration Plattform eZ Teamroom, die ebenfalls auf das CMS eZ Publish aufbaut, dient dabei bereits heute als Kommunikationsmedium für die im Rahmen der diesjährigen Sommerkonferenz gegründete Media User Group.

Weitere Informationen sind auf www.ez.no oder direkt über info.de@ez.no verfügbar.

Erschienen: 10/2008
Autor: Ralf Rutke


Nach langjähriger Tätigkeit in der in der Entwicklung, Beratung sowie im Vertrieb von Integrationstechnologien und ECM-Lösungen leitet Ralf Rutke heute als Geschäftsführer die eZ Systems GmbH mit Sitz in Dortmund.