Das Connector Framework


10.06.2009

Dehnen Sie Ihre Suche weiter aus: das Connector Framework

Mit dem Connector Framework lassen sich durch die Google Search Appliance auch Inhalte von Systemen indexieren, welche nicht oder nicht vollständig mit Crawling erfassbar sind.

Google bietet eigene und einfach in Betrieb zu nehmende Konnektoren an für: EMC Documentum, Open Text Livelink, Microsoft Sharepoint und IBM Filenet. Des Weiteren gibt es Konnektoren von Thirdparty Herstellern, z.B. für Acqualogic, Hummingbird, IBM Websphere, Interwoven, Notes und SAP. Diese sind im Solutions Marketplace registriert und erfordern, im Unterschied zu den Konnektoren von Google selbst, meist eine separate Lizenzierung. Zudem lassen sich eigene Konnektoren für das Erschließen von Eigenentwicklungen implementieren.

Wir haben den von Google bereitgestellten Sharepoint Konnektor getestet. Die Installation des Connectors muss auf einer Maschine erfolgen, die sowohl Zugriff auf die Google Search Appliance, als auch die zu erschließende Datenquelle hat. Der Vorgang (inklusive Deployment der Anwendung in den mitgelieferten Tomcat) verlief schnell und ohne Probleme, die vorzunehmende initiale Konfiguration ist minimal.

Da der Sharepoint Connector keinen Content- (mit Inhalten), sondern lediglich einen URL- und Metadaten-Feed liefert, müssen die entsprechenden URLs hinterlegt sein. Als ersten Schritt in der Anpassung der Konfiguration der Google Search Appliance haben wir darum, zur Vorbereitung des Crawlings, die Crawl Patterns angepasst. Ebenfalls müssen die zu exkludierenden Muster teilweise auskommentiert oder ergänzt werden, da die Google Search Appliance allen entdeckten URLs folgt und dadurch Probleme verursachen könnte.

Danach haben wir die Credentials hinterlegt, die für das Crawling verwendet werden sollen. Zu Testzwecken haben wir die von Sharepoint indexierten Inhalte als Public markiert: Der Benutzer erhält so auch Suchtreffer, ohne sich zu authentifizieren. Nimmt man diese Markierung nicht vor, müssen die Credentials des Benutzers abgefragt werden, bevor eine Suchanfrage beantwortet wird.

Nach diesen Schritten wird die eigentliche Konnektor-Konfiguration in Angriff genommen. Dazu wird als erstes der Connector Manager auf dem externen Server konfiguriert. Der Manager selbst ist noch nicht die eigentliche Konnektor-Instanz selbst, sondern stellt lediglich die Umgebung für den Konnektor zur Verfügung. Ein Connector Manager kann für mehrere Konnektoren verwendet werden.

Danach wird die eigentliche Konnektor-Instanz konfiguriert. Hat man einen Connector Manager ausgewählt, wird definiert, um welchen Typ von Konnektor es sich handelt. Anschließend wird das Konnektor-abhängige Konfigurationsformular geladen.

Sobald alle diese Konfigurationsschritte durchgeführt worden sind und die Google Search Appliance den ersten Feed erhalten hat, beginnt sie mit der Indexierung. Über eine eigene Ansicht im Admin Interface der Google Search Appliance kann das Eingehen von Feeds nachvollzogen und die im Index enthaltenen Daten lassen sich wie gewohnt einsehen.

Die Indexierung von aktualisierten und neuen Inhalten geschieht äußerst rasch – und die Daten sind schnell via Suchmaske erreichbar.

Implementierung und Betrieb einer Suchapplikation

Der vorliegende Artikel zeigt auf, wie mit Hilfe einer Google Search Appliances schnell und unkompliziert eigene Daten verschiedenster Art indexiert und auch durchsucht werden können.

Trotz der schnell erreichbaren Erfolgserlebnisse ist es dennoch empfehlenswert, die Implementierung einer Suchapplikation als reguläres Projekt aufzusetzen und dieses in allen Schritten sorgfältig durchzuführen. Zu diesen gehören

  • Analyse der Benutzerbedürfnisse und Identifizierung der Nutzungsszenarien
  • Definition der Ziele, die mit der Suchapplikation erreicht werden sollen
  • Analyse des Content hinsichtlich Quellsysteme, Qualität und Berechtigungen; Abklärung von rechtlichen und Compliance-Anforderungen
  • Definition der Subkollektionen und Spezifikation der Benutzeroberfläche (Suchmasken, Trefferliste)
  • Technische Implementierung der Suche
  • Testbetrieb mit Bewertung der Suchqualität im Hinblick auf die identifizierten Nutzungsszenarien
  • Launch und allenfalls Schulungen

Doch auch nach dem Launch sollte eine Suchapplikation im Betrieb laufend optimiert und gewartet werden. Im Zentrum steht die Frage, zu welchem Grad die Ziele erreicht werden, aber auch laufende Anpassung an neue Quellen, neue Bedürfnisse oder verändertes Suchverhalten der Benutzer sollten im Auge behalten werden. Folgt man diesen Schritten, so entfalten die Google Search Appliances ihr volles Potenzial beim effizienten Umgang mit relevanten Informationen.





blog comments powered by Disqus

Weitere Artikel zum Thema

alle Artikel zum Thema

Autor

  • Hilar Lütolf

    Namics AG

Hilar Lütolf ist Software Engineer bei Namics. Seine Schwerpunkte sind die Anwendungs-Entwicklung im Java-CMS-Umfeld (Adobe WEM, Magnolia) und Google Search Appliance.



Partner

Namics ist ein führender Webdienstleister in der Schweiz mit starker Präsenz in Deutschland. In St. Gallen, Zürich, Frankfurt, Hamburg und München bieten über 300 Mitarbeiter das gesamte Spektrum an hochwertigen, professionellen Services für E-Business un

zum Partnerprofil




Unsere Experten


alle Experten

Premium Lösungen

Marktübersicht

Premium Services

Dienstleisterübersicht