Enterprise Content Management - Zwischen Vision und Realität II

Autor: Dr. Ulrich Kampffmeyer
Eingetragen seit: 10/2001
Letzter Beitrag: 06/2010
Beiträge insgesamt: 59
Expertenprofil   Alle Experten   

DruckversionAls E-Mail versendenZum Magazin-Forum

Kapitel:



Capture (Erfassung)

Die Kategorie Capture beinhaltet Funktionalität und Komponenten zur Erstellung, Erfassung, Aufbereitung und Verarbeitung von analogen und elektronischen Informationen. Dabei kann man mehrere Stufen und Technologien unterschieden, von der einfachen Erfassung der Information bis zur komplexen Aufbereitung durch eien automatische Klassifikation. Die Capture-Komponenten werden auch häufig als "Input"-Komponenten zusammengefasst.

Abb. 1 "Capture" Komponenten von ECM

Manuell erzeugte und erfasste Informationen

Bei der manuellen Erfassung können alle Formen von Informationen vorkommen, von Papierdokumenten, elektronischen Office-Dokumenten, E-Mails, Vordrucken, MultiMedia-Objekten, digitalisierter Sprache und Video bis zum Mikrofilm.

Maschinell erzeugte und automatisch erfasste Informationen

Bei der teilautomatischen oder automatischen Erfassung können EDI- oder XML-Dokumente, kaufmännische und ERP-Anwendungen oder bestehende Fachanwendungssysteme die Quelle für die Erfassung sein.

Technologien zur Be- und Verarbeitung erfasster Informationen

Zur Verarbeitung von gescannten Faksimiles werden verschiedene Erkennungstechnologien (Recognition) eingesetzt. Zu Ihnen gehören:

  • OCR (Optical Charakter Recognition)

  • Hierbei werden die Bildinformationen in maschinenlesbare Zeichen umgesetzt. OCR wird für Maschinenschrift eingesetzt.
  • HCR (Handprint Charakter Recognition)

  • Die Erkennung von Handschriften ist eine Weiterentwicklung von OCR, die jedoch bei Fließtexten immer noch nicht zufriedenstellende Ergebnisse liefert. Beim Auslesen von definierten Feldinhalten ist die Methode doch bereits sehr sicher.
  • ICR (Intelligent Charakter Recognition)

  • ICR ist eine Weiterentwicklung von OCR und HCR, die die Qualität der ausgelesenen Ergebnisse durch Vergleiche, logische Zusammenhänge, Abgleich mit Referenzlisten oder Prüfung gegen vorhandene Stammdaten verbessert.
  • OMR (Optical Mark Recognition)

  • OMR, z.B. für Strichcode, liest mit hoher Sicherheit spezielle Markierungen in vordefinierten Feldern aus und hat sich bei Fragenbogenaktionen und anderen Vordrucken bewährt.
  • Barcode

  • Aufgebrachte Barcodes beim Versenden von Vordrucken können beim Einlesen der Rückläufer automatisiert erkannt und zugeordnet werden.

Bildbearbeitungstechniken von Document Imaging dienen nicht nur zur Anzeige von gescannten Bildern sondern ermöglichen auch die Verbesserung der Lesbarkeit für die Erfassung. Funktionen wie "Despeckling", das Entfernen von isolierten Bildpunkten oder das "Adjustment", das Geraderücken von schief eingezogenen Vorlagen verbessern die Ergebnisse der Erkennungstechnologien. Document-Imaging-Funktionen werden beim Erfassungsprozess bei der Qualitätskontrolle eingesetzt.

Bei der Erfassung von Formularen werden heute noch zwei Gruppen von Technologien unterschieden, obwohl der Informationsinhalt und der Charakter der Dokumente gleich sein kann.

- Forms Processing (Vordruckverarbeitung)
Das "Forms Processing" bezeichnet die Erfassung von industriell oder individuell gedruckten Vordrucken mittels Scannen. Hierbei kommen anschließend häufig Erkennungstechnologien zum Einsatz, da gut gestaltete Vordrucke eine weitgehend automatische Verarbeitung ermöglichen.

- E-Forms / Web-Forms (Verarbeitung elektronischer Formulare)
Bei der Erfassung elektronischer Formulare ist eine automatische Verarbeitung möglich, wenn Layout, Struktur, Logik und Inhalte dem Erfassungssystem bekannt sind.

COLD/ERM sind Verfahren zur automatisierten Verarbeitung von strukturierten Eingangsdateien. Der Begriff COLD steht für Computer Output on LaserDisk und hat sich gehalten, obwohl das Medium LaserDisk seit Jahren nicht mehr am Markt ist. Das Akronym ERM steht für Enterprise Report Management. In beiden Fällen geht es darum, angelieferte Ausgabedateien auf Basis vorhandener Strukturinformationen so aufzubereiten, dass sie unabhängig vom erzeugenden System indiziert und an eine Speicherkomponente wie eine dynamische Ablage (Store) oder ein Archiv (Preserve) übergeben werden können.

Die "Aggregation" stellt einen Kombinationsprozess von Dateneingaben verschiedener Erstellungs-, Erfassungs- und zuliefernden Anwendungen dar. Zweck ist die Zusammenführung und Vereinheitlichung von Informationen aus unterschiedlichen Quellen, um sie strukturiert und einheitlich formatiert an die Speicher- und Bearbeitungssysteme zu übergeben.

Komponenten zur inhaltlichen Erschließung erfasster Informationen

Für die Weiterleitung und inhaltliche Erschließung kommen in den Systemen weitere Komponenten hinzu, die die erfassten und digital vorliegenden Informationen aufbereiten und um beschreibende Merkmale ergänzen. Hierzu gehören:

  • Indexing (manuelle Indizierung)

  • Anders als im Deutschen beschränkt sich im Angloamerikansichen der Begriff Indexing auf die manuelle Vergabe von Indexattributen, die in der Datenbank einer "Manage"-Komponente für Verwaltung und Zugriff auf die Informationen benutzt wird. Im Deutschen werden hier auch Begriffe wie "Indizieren", "Attributieren" oder "Verschlagworten" benutzt.
  • Input Designs (Profile)

  • Sowohl die automatische als auch die manuelle Attributierung kann durch hinterlegte Profile erleichtert und verbessert werden. Solche Profile können z.B. Dokumentenklassen beschreiben, die die Anzahl der möglichen Indexwerte beschränken oder bestimmte Kriterien automatisch vergeben. Input Designs schließt auch die Eingabemasken und deren Logik bei der manuellen Indizierung ein.
  • Categorization (automatische Klassifikation oder Kategorisierung)

  • Auf Basis der in den elektronischen Informationsobjekten, seien es per OCR-gewandelte Faksimiles, Office-Dateien oder Ausgabedateien, enthaltenen Informationen können Programme zur automatischen Klassifikation selbstständig Index-, Zuordnungs- und Weiterleitungsdaten extrahieren. Solche Systeme können auf Basis vordefinierter Kriterien oder selbstlernend Informationen auswerten.

Ziel aller "Capture"-Komponenten ist, die erfassten Informationen zur Weiterbearbeitung oder Archivierung den "Manage"-Komponenten bereitzustellen.

Manage (Verwaltung, Bearbeitung, Nutzung)

Die "Manage"-Komponenten dienen zur Verwaltung, Bearbeitung und Nutzung der Informationen. Sie besitzen hierfür

  • Datenbanken für die Verwaltung und das Wiederauffinden sowie
  • Berechtigungssysteme zur Zugriffsabsicherung und zum Schutz

von Informationen. Ziel eines geschlossenen ECM-Systemes ist dabei, diese beiden Komponenten nur einmal übergreifend für alle "Manage"-Lösungen wie Document Management, Collaboration, Web Content Management, Records Management und Workflow / Business Process Management als Dienste bereitzustellen. Zur Verbindung der unterschiedlichen "Manage"-Komponenten sollte diese über standardisierte Schnittstellen und sichere Transaktionsprozesse bei der Kommunikation zwischen den Komponenten verfügen.

Abb. 2 "Manage" Komponenten von ECM

Lesen Sie das nächste Kapitel

weiter
 1: DM Document Management (Dokumentenmanagement)

11/2003, Dr. Ulrich Kampffmeyer





Dr. Kampffmeyer ist Geschäftsführer der PROJECT CONSULT Unternehmensberatung GmbH, Hamburg, eine produkt- und herstellerunabhängige Beratungsgesellschaft für Informationsmanagement (IM).
Alle Experten   
Publizieren Sie Ihren eigenen Fachbeitrag   

Mehr Informationen zu Project Consult


Kommentare zu diesem Beitrag 


Schreiben Sie einen Kommentar zu diesem Beitrag

Newsletter abonnieren

Verpassen Sie nichts und bleiben Sie informiert mit unserem Newsletter.
Ihre E-Mail Adresse:  
RSS-Feed: Alle News aktuellUnsere News auf Ihrer Website

Weitere Beiträge zu diesem Thema

GDPdU & Archivierung: Endlich Klarheit I
Die Diskussion um die GDPdU hat in letzter Zeit hohe Wellen geschlagen. Nachdem in den ersten 12 Monaten nach dem Inkrafttreten der Grundsätze kaum eine Reaktion erfolgt war, wird den steuerpflichtigen Unternehmen bewusst, dass ihnen die Zeit wegläuft...
Enterprise Content Management - Zwischen Vision und Realität III
Elektronisches Dokumentenmanagement gibt es erst seit ungefähr 25 Jahren. Nur was heißt in der Informationstechnologie "erst" 25 Jahre? 25 Jahre sind ein relativ langer Zeitraum. Lesen Sie den dritten und letzten Teil des Beitrages von Dr. Kampffmeyer...
Enterprise Content Management - Zwischen Vision und Realität
ECM Enterprise Content Management ist ein modernes Kunstwort, dass Produkte, Lösungen, einen Markt und eine Branche beschreiben soll. ECM fügt sich ein in das weite Feld der Informationstechnologie und soll Hilfsmittel bereitstellen...
Revisionssichere Archivierung im Licht neuer rechtlicher Anforderungen VII
Heute schließen wir die Beitragsreihe über revisionssichere Archiverung im Licht neuer rechtlicher Anforderungen mit dem letzten Teil zum Thema Migration ab. Alle Beiträge werden natürlich archiviert und sind jederzeit abrufbar...
Revisionssichere Archivierung im Licht neuer rechtlicher Anforderungen VI
Werfen wir noch einmal einen Blick auf die unterschiedlichsten Formen der Information die ein Archiv speichern können muss. Zahlreiche Informationen erzeugen Sie aber selbst und können daher im Prinzip auch selbst bestimmen, wie sie strukturiert werden...

Beiträge aus anderen Themenbereichen

VOICE Days plus: Deutschlands Servicewelt im Fokus
Im Interview spricht der Schirmherr der Initiative Prof. Dieter Spath über "Das Konstruktionsbüro für Dienstleistungen" und vieles mehr. Am 12. Oktober eröffnet Prof. Dieter Spath den VOICE Days plus Kongress...
Lösungsmöglichkeiten zum Konflikt der E-Mail-Archivierung mit Fernmeldegeheimnis und Datenschutz
Die Gestattung der privaten Nutzung der betriebseigenen IT-Infrastruktur durch die Mitarbeiter bringt nicht zu unterschätzende rechtliche Komplikationen mit sich – gerade was auch die Archivierung von E-Mails anbelangt...
eCommerce & Datenschutz - Das sollten Sie wissen
Datenschutz spielt auch im eCommerce eine große Rolle. So müssen z.B. für den Betrieb eines Onlineshops die gesetzlichen Vorschriften zum Datenschutz eingehalten werden...

Aktfotografie
Das Content Management PortalDas Dokumenten Management PortalDas IT-Security PortalDas Customer Relationship Management PortalDas E-Commerce PortalDas Enterprise Resource Planning PortalPortal für VoIP und mobile KommunikationDas Magazin für IT im KrankenhausDas Verzeichnis für IT-Profis
homeimpressumerklärung zum datenschutz - privacy policykontaktwerbung

know how

news

veranstaltungen

Schnellsuche