Warum wird das Semantic Web im Knowledge Management so wenig beachtet

Warum wird das Semantic Web im Knowledge Management noch so wenig beachtet?

Christian Fillies

Semtation GmbH

Bredower Straße 145

14612 Falkensee

Tel.: +49-173-899 68 01

Email: cfillies@semtalk.com

Dr.-Ing. Frauke Weichhardt

beratung im netz

Merkurstraße 17

14482 Potsdam

Tel.: +49-172-317 12 81

Email: fweichhardt@fweichhardt.de

Für viele Beteiligte in der Knowledge Management Community ist Knowledge Management primär eine organisatorische bzw. soziale Aufgabe, zu deren Bewältigung technische Lösungen nur wenig beitragen können. Das W3C hat im Bereich Semantisches Web [1] viele Fortschritte gemacht, die es bereits heute ermöglichen, den Übergang von nur in Textform vorhandenem Wissen in formales Wissen mit wenig Aufwand zu vollziehen. W3Cs Lösungsansatz basiert auf dem Resource Description Framework (RDF) Standard [2,3] zur Repräsentation von Metadaten.

Das Semantic Web ist die Vision, zu einem Dokument soviel Meta Information über seinen Inhalt hinzuzufügen, dass man maschinell oder manuell leicht feststellen kann, ob es relevant für die aktuelle Fragestellung ist. Grundvorrausetzung dafür ist, dass die Metainformationen mit Hilfe von konsistenten, abgestimmten und allgemein verständlichen Ontologien gebildet werden. Oft genannte Einwände, die wir hier entkräften wollen, sind: „RDF ist ein Overkill, wenn ich nur meine Dokumente finden will“ und “SemanticWeb ist Künstliche Intelligenz (KI) und wir wollen nichts mit KI zu tun haben“.

Im Folgenden zeigen wir anhand der drei Applikationen SemanticMinerTM [6], SemTalk Search und TAP [7] auf, welcher Nutzen im Knowledge Management schon jetzt aus Semantic Web Technologie gezogen werden kann, ohne dass dazu jedes einzelne Dokument in RDF abgebildet werden muss.

1 Einführung

Kernidee des Knowledge Managements ist es, eigenes Wissen anderen so zur Verfügung zu stellen, dass sie es zum einen leicht wieder finden und zum anderen leicht nutzen können. In der Praxis haben sich dabei folgende Schwerpunkte herausgebildet:

Finden von Dokumenten zu einem bestimmten Thema
Finden von Kompetenzträgern
Finden von Produkten und Materialien
Finden von Verfahrensanweisungen z.B. im QM

Gemeinsam ist allen Einsatzgebieten, dass man wie mit einer Suchmaschine Dinge zu einem oder mehreren Begriffen sucht. Warum braucht man dafür aber ein Semantic Web? Eigentlich braucht man für KM nur eine gemeinsame Sprache, also eine Ontologie oder ein Glossar der Dinge, über die man Wissen austauschen will. Zum Semantic Web wird ein Glossar, wenn es maschinenlesbar ist, wenn die Namen eindeutig sind und wenn das Glossar auf verschiedene Stellen, zum Beispiel im Internet, verteilt werden kann. Wichtig ist, dass man gemeinsame Begriffsdefinitionen benutzt und diese einheitlich zur Indizierung von Dokumenten, zur Beschreibung von Kompetenzen und in der Prozessmodellierung einsetzt. Wichtig ist auch, dass man mit Obergriffen und Unterbegriffen suchen kann. Dieses ermöglicht zum Beispiel, einen Text mit dem Wort Porsche zu finden, wenn man nach Auto gesucht hat. Gegenwärtige Suchmaschinen wie Google können nicht zwischen den verschiedenen Bedeutungen eines Wortes unterscheiden (Homonyme) und finden auch keine Verwendungen synonymer Worte.

Das Problem der Unternehmensontologie wird genau dann akut, wenn man Knowledge Management mit IT-Unterstützung einführt. Alle Knowledge Management Systeme benötigen Strukturierungsmittel wie z.B. Taxonomien. Im einfachsten Fall sind dieses unternehmensweite Keywords für Worddokumente. Wird nun ein zweites Wissensmanagementsystem eingesetzt wie zum Beispiel eine Prozessdokumentation, laufen diese Begriffssysteme schnell auseinander.

Taxonomien können sehr schnell komplex werden und weisen oft eine Netzstruktur auf. Deshalb sollten sie als Modell erstellt werden und nicht als Excel-Liste, wie man es in der Praxis häufig findet, um ihre Wartbarkeit zu gewährleisten.

Mit Hilfe von XML basierten Semantic Web Standards wie RDFS / OWL [12] kann aus diesen Keywords ein zentrales Wissensmodell zugreifbar für alle Anwendungen geschaffen werden. Diese Grundlage für die Erstellung von Taxonomien ist in der Domäne des Wissensmangements bisher allerdings wenig bekannt und wird entsprechend wenig genutzt. Sie steht teilweise in Konkurrenz zu der Verwendung von Topic Maps, erweitert aber den dort verwendeten inhaltlichen Ansatz um die Perspektiven des Semantic Web.

Im folgenden sollen die Möglichkeiten von RDF kurz erläutert werden, um dann auf die Verwendung von RDF als Modellierungstechnologie einzugehen.

2 Annotierungen („RDF ist ein Overkill wenn ich nur meine Dokumente finden will“)

2.1 Meta Informationen in MS Office Dokumenten

RDF dient dazu, Metainformationen als Aussagen über einzelne Dokumente, Bilder, Produkte usw. in maschinenlesbarer Form abzulegen. Dieses können klassische Metainformationen sein wie z.B. Autor, Organisationseinheit und Schlagworte. Solche Metainformationen sind auch jetzt schon in Office Dokumenten zum Teil als XML enthalten:

<o:DocumentProperties>

<o:Author>Christian Fillies</o:Author>

<o:Keywords>Semantic Web; RDFS; OWL; Knowledge Management</o:Keywords>

<o:LastAuthor>Christian Fillies</o:LastAuthor>

<o:Revision>2</o:Revision>

<o:Created>2002-09-23T12:18:00Z</o:Created>

<o:LastSaved>2002-09-23T12:18:00Z</o:LastSaved>

<o:Pages>1</o:Pages>

<o:Words>791</o:Words>

<o:Characters>4990</o:Characters>

<o:Company>Semtation GmbH</o:Company>

<o:Lines>41</o:Lines>

<o:Paragraphs>11</o:Paragraphs>

<o:CharactersWithSpaces>5770</o:CharactersWithSpaces>

<o:Version>10.3311</o:Version>

</o:DocumentProperties>

<o:CustomDocumentProperties>

<o:_AdHocReviewCycleID dt:dt="float">685886317</o:_AdHocReviewCycleID>

<o:_EmailSubject dt:dt="string">Knowtech2002frauke.doc</o:_EmailSubject>

<o:_AuthorEmail dt:dt="string">fweichhardt@fweichhardt.de</o:_AuthorEmail>

<o:_AuthorEmailDisplayName dt:dt="string">Frauke Weichhardt</o:_AuthorEmailDisplayName>

<o:_PreviousAdHocReviewCycleID dt:dt="float">-78351688</o:_PreviousAdHocReviewCycleID>

</o:CustomDocumentProperties>

Abbildung 1: Meta Daten eines MS Word-Dokumentes

Die gegenwärtigen Metainformationen können jedoch praktisch nur von proprietären Suchmaschinen wie dem Microsoft Indexdienst oder Sharepoint Portal Server verstanden werden.

2.2 Dublin Core und RDF

Mit RDF und insbesondere der Erweiterung Dublin Core Metadata Initiative (DC) http://dublincore.org/ könnten die darin enthaltenen Informationen nicht nur in standardisierter Syntax sondern auch mit standardisierter Semantik abgelegt und gefunden werden. Dublin Core Tags sind title, creator, subject, description, publisher, contributor, date, type usw.

Dublin Core selbst ist HTML-basiert:

<link rel="schema.DC" href="http://purl.org/dc">
<meta name="DC.Title" content="SemTalk">
<meta name="DC.Subject" content="SemTalk; Semantic Web; Semantisches Web; Smart Tag;SmartTag; Office XP; Visio; RDF; RDFS; DAML; DAML+OIL; OWL; Modeling; Process; Geschäftsprozeß; Geschäftsprozessmodellierung; Wissensmanagement; KM; GPO; BPM;Bonapart; Bonaparte; ARIS; PROMET; Knowledge Management; Promet.">
<meta name="DC.Description" content="TheSemTalk Homepage. Visio2000 based editor for theSemantic Web">
<meta name="DC.Date" scheme="W3CDTF" content="2002-07-07">
<meta name="DC.Type" scheme="DCMIType" content="Text">
<meta name="DC.Format" content="text/html">
<meta name="DC.Format" content="2075 bytes">
<meta name="DC.Identifier" content="http://www.semtalk.com">

Abbildung 2: Dublin Core Metadaten

Dublin Core gibt es aber auch als XML basierte RDF Implementierung:

<?xml version="1.0"?>

<!DOCTYPE rdf:RDF SYSTEM "http://purl.org/dc/schemas/dcmes-xml-20000714.dtd">

<rdf:RDF

  xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

  xmlns:dc="http://purl.org/dc/elements/1.1/">

  <rdf:Description about="http://www.semtalk.com">

    <dc:title>

      SemTalk

    </dc:title>

    <dc:subject>

      SemTalk; Semantic Web; Semantisches Web; Smart Tag;

      SmartTag; Office XP; Visio; RDF; RDFS; DAML; DAML+OIL; OWL;

      Modeling; Process; Geschäftsprozeß;

      Geschäftsprozessmodellierung; Wissensmanagement; KM; GPO;

      BPM; Bonapart; Bonaparte; ARIS; PROMET; Knowledge

      Management; Promet.

    </dc:subject>

    <dc:description>

      The SemTalk Homepage. Visio 2000 based editor for the

      Semantic Web

    </dc:description>

    <dc:publisher>

    </dc:publisher>

    <dc:date>

      2002-07-07

    </dc:date>

    <dc:type>

      Text

    </dc:type>

    <dc:format>

      text/html

    </dc:format>

    <dc:format>

      2075 bytes

    </dc:format>

  </rdf:Description>

</rdf:RDF>

Abbildung 3: Dublin Core in RDF

RDF mit Dublin Core vereint also die XML-Repräsentation von Word mit den normierten Bezeichnern von Dublin Core. In dieser Form ist die Beschreibung von http://www.semtalk.com sehr viel leichter maschinell zu verarbeiten als in einer HTML Repräsentation. Gleichzeitig wird durch RDF auch eine Integration in WM-Anwendungen verschiedener Hersteller möglich.

Die Erstellung von solchen RDF Metadaten ist nicht wesentlich aufwendiger als das Angeben von Keywords in MS Word und wird durch Tools wie z.B. DC Dot http://www.ukoln.ac.uk/metadata/dcdot/ unterstützt.

RDF wird bereits jetzt eingesetzt: So wird Adobe’s PDF in Kürze RDF unterstützen. Meta-Informationen können in standardisierter Form als XML in MS Office Dokumente eingebettet werden. Es macht deshalb auf jeden Fall Sinn, Meta-Informationen schon jetzt im Semantic Web Format zu verwalten. RDF repräsentiert Daten als Graphen – es ist schwer sich ein einfacheres Datenformat vorzustellen.

2.3 Akuelle RDF Annotationen

Betrachtet man die verschiedenen oben erwähnten Formate, fällt auf, dass der wirkliche Inhalt des Dokuments bzw. der Webseite nicht modelliert ist, sondern nur eine Liste von Keywords (bzw. Subjects) angegeben wird. Dieses gilt interessanterweise auch für die Seiten, die von Semantic Web Forschern selber für die erste Semantic Web-Konferenz ISWC 2002 annotiert wurden http://annotation.semanticweb.org/iswc/documents.html.[1] Über DC hinausgehend wurde hier eine gemeinsame Ontologie verwendet um zu modellieren, was ein Forscher ist, was ein Projekt ist und was eine Universität. Was nicht modelliert wurde, ist das, was in den einzelnen Papieren wirklich enthalten ist. Statt dessen wurde eine immerhin strukturierte Liste von „Topics“ (Keywords, Subjects) verwendet. Zur Annotierung wurde unter anderem OntoMat http://km.aifb.uni-karlsruhe.de/annotation/ontomat.html eingesetzt.

Abbildung 4: Visualisierung von RDF Annotationen

Mit Hilfe von SemTalk haben wir das entstehende Netzwerk von Personen, Projekten, Dokumenten konsolidiert und visualisiert http://www.semtalk.com/pub/sardinia.htm, so dass es jetzt als eine Art graphisches Yellow Page System für Semantic Web Experten dienen kann. Dieses Szenario ist natürlich auf beliebige andere Expertennetzwerke (Network of Excellence, Community of Practice,...) übertragbar.

2.4 Modellierung von Aussagen

Für das praktische Wissensmanagement sind auch diese Modellierungen eigentlich nicht optimal verwertbar, da man von außen, also per Suchmaschine oder durch Betrachtung des graphischen Modells, immer noch nicht feststellen kann, ob in dem Dokument etwas Sinnvolles enthalten ist. Das Semantic Web erreicht erst dann sein volles Potential, wenn man beginnt, den Inhalt des Dokumentes, also die Aussagen, die darin gemacht sind, zu formalisieren. Mit SemTalk lassen sich auch diese Aussagen modellieren. Wir haben in verschiedenen Papieren [10] (http://www.semtalk.com/pub/KnowTech2001.htm, und http://www.semtalk.com/pub/www2002.htm) detailliert beschrieben, wie eine solche graphische Modellierung von Inhalten innerhalb von Visio mit einfachsten Mittel durchgeführt werden kann.

Vollständige Dokumente zu modellieren ist natürlich mit beträchtlichem Aufwand verbunden und auch rein aufgrund der Ausbildung sicher nicht von jedem Autor zu erwarten:

> Recent Google co-founder Sergey Brin said (in speaking about RDF) "I'd

> rather make progress by having computers understand what humans write,

> than by forcing humans to write in ways computers can understand."

In einer Weise zu schreiben, dass es ein Computer „versteht“, bedeutet, detailliert zu modellieren bzw. zu formalisieren. Eine ähnliche Situation gab es vor Jahren in der Geschäftsprozessmodellierung mit der Frage: Muss ich einen Geschäftsprozess simulieren (also von der Maschine interpretieren lassen) oder reicht es aus, ein Bild zu malen, das die anderen Mitarbeiter verstehen? In den meisten Fällen wird das Modell zur Kommunikation mit Menschen genutzt, obwohl es natürlich auch Situationen gibt, in denen ein maschinell interpretierbares Modell sinnvoll ist, zum Beispiel für den Betrieb kommerzieller Webseiten oder Webservices. Im Kontext von Wissensmanagement ist der Aufwand für eine maschinen-lesbare Modellierung häufig nicht durchsetzbar.

Generell ist es aber auch nur selten erforderlich und lohnenswert, den gesamten Inhalt eines Dokumentes zu formalisieren. In der Regel ist es ausreichend, die zentralen Begriffe eines zu veröffentlichenden Dokumentes zu modellieren, wie auf einem Whiteboard, anhand dessen man den Inhalt des Papiers jemand anderem erklären würde. Für den menschlichen Leser ist es empfehlenswert, das graphische Bild des skizzierten oder modellierten Szenarios dem Dokument hinzuzufügen. Im Prinzip sind dazu nur die Keywords des Word-Dokumentes mit allgemeinen Begriffen aus einer (Unternehmens-) Ontologie in Beziehung zu setzen und deren Zusammenhänge sind aufzuzeigen. Auch ein nur kleines Modell im Dokument bringt dem menschlichen Leser großen Nutzen, und es verbessert die Fähigkeit, von den neuen intelligenten Suchmaschinen gefunden zu werden. Gemessen an dem Aufwand, den Leute betreiben, um ein gutes Google-Rating zu erzielen, ist dieser Aufwand noch recht überschaubar.

Mit einem Minimum an Zusatzaufwand lässt sich also auch auf Dokumentebene Nutzen ziehen:

Futter für intelligentere Suchmaschinen

Übermittlung von Wissen durch graphische Darstellung (lange Tradition in der Prozessmodellierung)

Statt Texte in Modelle zu überführen, ist es in vielen Fällen effizienter, wichtiges Wissen direkt in Modellen ablegen. Ein typisches Beispiel dafür sind Geschäftsprozessmodelle und Verfahrensanweisungen oder Ontologien. Hier werden die Modelle oft durch textuelle Beschreibungen ergänzt, auf die aus den Modellen verwiesen wird.

Wir haben in diesem Abschnitt ein Spektrum von Annotations-Techniken aufgezeigt: von MS Word / HTML Keywords über RDF Annotation bis hin zur inhaltlichen Beschreibung der Dokumente. Ob sich der jeweilige Aufwand lohnt, hängt sicher vom konkreten Einsatzszenario ab. Was aber in jedem Fall notwendig ist, ist eine Ontologie der wichtigsten Objekte, da diese dann in allen Fällen, d.h. auch bei reinen Text-Dokumenten zur Klassifikation und Suche verwendet werden kann.

Die Semantic Web Community hat mit der Definition einer W3C Recommendation zur Wissensmodellierung einen entscheidenden Beitrag zur Integrierbarkeit von Wissensmanagementwerkzeugen und zur Verteilbarkeit von formalisiertem Wissen geleistet.

3 Anwendungen (“Semantic Web (OWL) ist KI und wir wollen nichts mit KI zu tun haben“)

Das Semantic Web hat eine sehr weitreichende Vision intelligenter vernetzter Maschinen und Agenten, von denen nur einige Aspekte etwas mit KI zu tun haben. Das Hauptproblem im Semantic Web ist die Herstellung von Interoperabilität zwischen Maschinen auf der Datenebene.

Zur Zeit entstehen einfache aber intelligente Applikationen, initiale semantische Inseln, die schon jetzt Meta Daten mit Semantic Web Technologien nutzen. Diese initalen semantischen Inseln sind Kristallisationspunkte für das Semantic Web, da sie Anreize bieten, eigene Daten und Anwendungen mit den existierenden zu verknüpfen.

3.1 Semantic Search

Aus der Sicht des Wissensmanagements ist „Semantic Search“ die wichtigste Anwendung des Semantic Web. Sie liefert neben Texten auch Daten. Dieses sind explizit vorhandene und durch Inferenzen berechnete Daten. Wissensbasierte Suche ist eine Suche, die beim Suchen eine Ontologie verwendet, um die gefundenen Daten zu interpretieren. Sind die Dokumente mit Modellen annotiert, wird die Suche zum „Matching“, also zum Mustervergleich in semantischen Netzen. Dieses ist natürlich ein Bezug zu Technologien der künstlichen Intelligenz, hat aber nicht den Anspruch, menschliche Experten nachzubilden.

Zum Auffinden komplexer Muster in semantischen Netzen stehen eine Reihe von Inferenzmaschinen in Semantic Web Technologie zur Verfügung. Die wichtigsten kommerziell verfügbaren Produkte sind Ontobroker von ontoprise GmbH [11], Cerebra von Network Inference [8] und Sesame von Aidministrator [9].

Es gibt noch kein wirklich existierendes Semantic Web. Weder auf der Festplatte, noch im Intranet oder in den Groupware Plattformen oder im Internet. Der aktuelle Stand der Technik nutzt deshalb Ontologien zusammen mit klassischen Suchmaschinen wie Google, oder eigenen Suchmaschinen wie dem Sharepoint Portal Server.

Im Folgenden wollen wir zwei Lösungen auf Basis der MS Indizierung vorstellen, die auf jedem Windows2000 Rechner standardmäßig vorhanden ist, und werden dann kurz auf das leider noch wenig bekannte TAP System eingehen, dass externe Datenbanken über RDF mit einer Google-Suche kombiniert.

3.2 SemanticMiner^TM

Der SemanticMiner der ontoprise GmbH ist eine semantische Knowledge Retrieval Plattform, die Ontologien als Schnittstelle über heterogene Datenquellen spannt. Die Ontologien werden zur Navigation und Erstellung semantischer Suchanfragen genutzt, damit der Anwender keine spezifische Anfragesyntax beherrschen muss. Der integrative Charakter der Ontologien ermöglicht die inhaltliche Kombination von Antworten aus verschiedenen Quellen, ohne dass der Anwender wissen muss, in welchen Quellen welche Informationen vorliegen.

Ontologien für den SemanticMiner können mit OntoEdit oder SemTalk erstellt werden.

Um die Anfragen zu generieren, wird der OntoBroker eingesetzt, um z.B. alle Unterbegriffe eines aktuellen Begriffs zu ermitteln. Es existiert eine einfach zu bedienende Oberfläche zur Konstruktion komplexer Abfragen, die aber nicht den vollen Sprachumfang des OntoBrokers umfasst. Für spezielle Fragestellungen kann das System aber unter Nutzung der vollen Funktionalität des OntoBrokers erweitert werden.

Abbildung 5: SemanticMiner

Der SemanticMiner kann darüber hinaus z.B. Suchanfragen für AltaVista generieren und nach Experten zu den ausgewählten Themen im Indexserver oder Internet suchen. Neben der Suchfunktionalität können über statistische Verfahren Dokumente analysiert (Kollokationsanalyse) und klassifiziert (Klassifikation mittels Support Vector Machines) werden. Der SemanticMiner beinhaltet zudem eine Visualisierungskomponente, über die graphisch in einem Wissensmodell navigiert werden kann.

3.3 SemTalk Search

SemTalk Search ist ähnlich zum SemanticMiner eine ontologiebasierte Suchoberfläche, die Anfragen für die MS Indizierung generieren kann, um Dokumente im Dateisystem zu finden.

Statt des OntoBrokers^TM wird hier die COM-basierte In-Memory Engine von SemTalk zur Generierung der Anfragen eingesetzt. SemTalk Search kann unabhängig von der Visio-basierten Editor-Umgebung SemTalk eingesetzt werden. Die zur Suche verwendete Ontologie kann auch im Internet an einer allgemein zugänglichen Stelle abgelegt sein.

Im Gegensatz zum SemanticMiner werden hier nur Dokumente und keine Experten gesucht. Stattdessen können aber auch Begriffe in SemTalk Modellen und in DAML/OWL gefunden werden.

Sucht man anhand einer Fahrzeug-Ontologie z.B. nach dem Begriff Auto, werden automatisch die Unterklassen PKW, LKW und evtl. vorhandene Objekte wie das konkrete Auto BI-JZ 442 in die Suche mit eingeschlossen. Des weiteren können Synonyme, sofern Sie in der Ontologie enthalten sind, gefunden werden. Wichtig ist auch, dass die Begriffe mehrfach klassifiziert werden können (multiple Vererbung). Auch diese Weise ist es möglich, verschiedene, personalisierte Sichten auf die Anwendungsdomäne einzunehmen.

Bei dieser Vorgehensweise werden im Vorfeld keine Dokumente automatisch oder manuell klassifiziert, sondern die Dokumente werden dynamisch, also zur Ausführungszeit der Anfrage, mit der aktuellen Ontologie verglichen. Dieses Vorgehen hat natürlich einen Zeit- und Kostenvorteil.

Wie auch beim SemanticMiner können hier externe Ontologien im DAML- bzw. dem neuen OWL-Format zur Bildung der Suchanfragen benutzt werden. Eine Sammlung bereits vorhandener Ontologien findet sich z.B. auf http://www.daml.org/ontologies/. Sie können auch recht einfach z.B. mit SemTalk graphisch erstellt werden.

Abbildung 6: SemTalk Search

Der eigentliche Fokus von SemTalk Search liegt aber in der Kombination mit der graphischen Darstellung der Ontologie. Dabei ist es zunächst wichtig, die Ontologie zu verstehen, anhand derer gerade gesucht wird. Eine hierarchische Darstellung der Ober- und Unterbegriffe findet sich bereits im linken Teil der Suchoberfläche. Eine graphische Darstellung der Begriffe im Kontext ist aber wesentlich geeigneter, um eine Ontologie zu verstehen. Um zu lernen, was die Autoren der Ontologie gemeint haben, ist ein Bild mit weiteren Beziehungen und Objekten wesentlich intuitiver und damit schneller verständlich als ein reiner Klassenbaum. Es zeigt sich, dass sich der Aufwand lohnt, Ontologien manuell zu gestalten, also über Layout, Formen, Farbe und Kommentare Aussagen zu betonen. Es ist deshalb sinnvoll, die Ontologien gleich graphisch zu erstellen, anstatt sie textuell zu erfassen und dann später zu versuchen, sie graphisch aufzubereiten. Die Modellinhalte haben eine relativ geringe Änderungsfrequenz und dienen überwiegend der Navigation in der Ontologie.

Wir verwenden hier eine graphische HTML/VML-Darstellung des aktuellen Begriffes und seines Umfeldes wie sie im folgenden Bild zu sehen ist. Die HTML-Oberfläche zeigt auch die weiteren modellierten Eigenschaften des Objektes und ermöglicht eine Navigation in der Ontologie, um z.B. auch andere Kontexte zum gesuchten Begriff aufzuzeigen.

Abbildung 7: Navigation in Ontologien mit SemTalk Search

Es werden aber nicht nur anhand einer ausgewählten Ontologie Dateien gesucht, sondern es werden auch andere Ontologien durchsucht, die im Zugriff des MS Indexing Services liegen.

D.h. es werden nicht nur Dokumente gefunden, sondern auch ganz allgemein SemTalk oder DAML-Modelle. Das Suchergebnis von SemTalk Search liefert also unstrukturierten Text und strukturierte Daten im Modell zum gesuchten Begriff. Bei den Modellen kann es sich nahezu um beliebige Modelle handeln: Geschäftsprozesse, Produktmodelle und, wie im vorhergehenden Kapitel angesprochen, um Annotierungen besonders wichtiger Dokumente oder allgemeine Ontologien des Unternehmens. In diesem Fall kann dann über die gefundenen manuell modellierten Zusammenhänge auf die besonders wichtigen Dokumente zugegriffen werden.

SemTalk Search zeigt, wie auch jetzt schon Ontologien - und damit das Kernstück des Semantic Web - zum Wissensmanagement am Arbeitsplatz und im Unternehmen genutzt werden können. Dazu ist nur ein geringer Aufwand an Infrastruktur und Modellierung notwendig.

3.4 TAP

Anwendungen von “Semantic Search” gibt es z.B. im TAP System von Stanford / IBM, das neben normalen Suchmaschinen wie Google auch relevante Zusatzinformationen auf Grund von Ontologien liefert http://tap.stanford.edu/ss/ bzw. http://www.alpiri.com/sw002.html. TAP integriert Informationen, die von verschiedenen Providern als SOAP Web-Services zur Verfügung gestellt werden, wie z.B. Informationen über Bücher und Autoren von Amazon. Das eigentliche Problem liegt darin, dass die verschiedenen Provider keine einheitlichen URIs (standardisierte Indentifizierer) benutzen.

In unserem Kontext besonders spannend ist die so genannte „Activity Based Search“, die als eine Anwendung von TAP realisiert wurde. Die Grundannahme ist dabei, dass hinter jeder Suche ein bestimmter Zweck bzw. eine Aktivität steht. Sucht man nach dem Namen eines Interpreten, ist es naheliegend, dass man sich für eine CD des Interpreten interessiert. Sucht man nach einem Ort, ist wahrscheinlich eine Landkarte bzw. ein Stadtplan relevant. Diese strukturierten Informationen, also Daten, werden mit den gefundenen Texten von Google kombiniert.

Abbildung 8: Activity based Search in TAP

Richtungweisend ist bei diesem Ansatz, dass nicht “einfach” Techniken des Collaborative Filtering, wie sie z.B. Amazon nutzt, eingesetzt werden, sondern dass die Suchanfragen in einer Ontologie gematcht werden, die Aktivität erkannt wird und dann mit Hilfe von Semantic Web Webservices die relevanten Daten angezeigt werden.

Dieser Ansatz ist die logische Fortführung der vergleichsweise einfacheren Lösungen von SemanticMiner und SemTalk Search, da er zum einen Benutzerprozesse mit berücksichtigen kann und zum anderen RDF Metadaten aus externen Quellen integriert.

4 Fazit

Unserer Ansicht nach wird das Semantic Web im praktischen Knowledge Management derzeit wenig beachtet, weil die dahinter liegende Technologie als komplex empfunden wird und nur wenig konkrete Anwendungen existieren, die ihren Nutzen verdeutlichen; d.h. es wird ignoriert, weil RDF den Ruf hat, nur mit sehr viel Aufwand und kryptischen Metadaten wenig nützliche Ergebnisse zu liefern, da noch keine Suchmaschinen diese Daten interpretieren können.

Wir haben versucht in diesem Artikel aufzuzeigen, dass man auch mit sehr wenig Aufwand und einem ontologie-basierten Vorgehen aus dem Semantic Web sofort großen Nutzen ziehen kann. Ontologien müssen für jedes Wissensmangementsystem beschrieben werden. Der Aspekt, sie aufteilen und gemeinsam konsistent nutzen zu können, spricht sehr für das Semantic Web. Wenn schon die aus unserer Sicht lohnenswerte Investition in Ontologiearbeit gemacht wird, dann sollte sie auf einer W3C Recommendation für Wissensmodelle, analog zu XML für Daten, basieren.

5 Literatur und Links

The Semantic Web, Tim Berners-Lee, James Hender, Ora Lassila, Scientific American, May 2001, http://www.sciam.com/2001/0501issue/0501berners-lee. Html
Resource Description Framework Model and Syntax Specification, Ralph Swick, Ora Lassila (editors), http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/
Resource Description Framework Schema Specification, Dan Brickley, et. al. (editors), http://www.w3.org/TR/2000/CR-rdf-schema-20000327/
DAML+OIL, Ian Horrocks, et. al. http://www.daml.org/2001/03/daml+oil-index
Simple Object Access Protocol (SOAP) 1.1 , Don Box, et. al. http://www.w3.org/TR/SOAP/
Technologische Grundlagen des Semantic Web, Steffen Staab, http://www.aifb.uni-karlsruhe.de/AIK/veranstaltungen/aik9/presentations/slides/aik-sst.pdf
A System for integrating Web Services into a Global Knowledge Base, R.V.Guha & Rob McCool http://tap.stanford.edu/ss/ bzw. http://www.alpiri.com/sw002.html
http://www.networkinference.com/
Sesame - Querying the Semantic Web, Arjohn Kampman & Jeen Broekstra http://www.ontoknowledge.org/countd/countdown.cgi?sesame.ppt und http://sesame.aidministrator.nl/
A Pragmatic Application of the Semantic Web Using SemTalk. Fillies, C., Wood-Albrecht, G., Weichhardt, F., WWW2002, May 7-11, 2002, Honolulu, Hawaii, USA ACM 1-5811-449-5/02/0005 http://www.semtalk.com/pub/www2002.htm bzw. http://www.semtalk.com/pub/KnowTech2001.htm
Knowledge Processes and Ontologies, Steffen Staab and Rudi Studer, Institute AIFB—University of Karlsruhe and Ontoprise GmbH, Hans-Peter Schnurr, Ontoprise GmbH, York Sure, Institute AIFB—University of Karlsruhe: In: IEEE INTELLIGENT SYSTEMS, 1094-7167/01
OWL Web Ontology Language 1.0 Reference, Mike Dean, Dan Connolly, Frank van Harmelen, James Hendler, Ian Horrocks, Deborah L. McGuinness, Peter F. Patel-Schneider, Lynn Andrea Stein http://www.daml.org/2002/06/webont/owl-ref-proposed

[1] Öffnen Sie einzelne Abstracts und betrachten Sie den Quelltext der Seiten.