Pragmatische Anwendungen des Semantic Web mit SemTalk

Christian Fillies

SC4 Solution Clustering

Bredower Str 145

14612 Falkensee

cfillies@semtalk.com

André Schulze

Fachhochschule Brandenburg

Magdeburger Str. 50

14770 Brandenburg an der Havel

schulzan@fh-brandenburg.de

Dr.-Ing Frauke Weichhardt

beratung im netz

Merkurstr. 17

14482 Potsdam

fweichhardt@fweichhardt.de

Prof. Dr. Dietmar Wikarski

Fachhochschule Brandenburg

Magdeburger Str. 50

14770 Brandenburg an der Havel

wikarski@fh-brandenburg.de

Pragmatische Anwendungen des Semantic Web mit SemTalk

Zusammenfassung

Das „Semantic Web“ ist eine neue Schicht des Internet, die eine verteilte Modellierung von Inhalten der bestehenden Webseiten ermöglicht. Dabei werden nicht mehr nur Texte, sondern auch Whiteboard-Files oder Skizzen mit den wichtigsten Zusammenhängen abgelegt. Bei Verwendung normierter Ontologien entstehen so ganz neue Suchmöglichkeiten. „Ambiente“ intelligente Anwendungen und Agenten können dieses Wissensnetz auf vielfältige Weise nutzen.

Mit SemTalk steht ein einfach zu bedienender Editor für Semantic-Web-Ontologien und Prozesse auf Basis von MS-Visio zur Verfügung. Durch ein offenes, graphisch konfigurierbares Meta-Modell kann Visio leicht an verschiedene Modellwelten wie ARIS EPKs oder Bonapart-Modelle angepaßt werden. Die Modelle stehen mit Hilfe von MS-Office XP SmartTags jedem Nutzer bei der täglichen Arbeit mit Winword, Excel oder Outlook im direkten Zugriff zur Verfügung.

Im vorliegenden Beitrag werden zwei Anwendungen dieser Technologie vorstellt:

Abteilungsübergreifende Informationsmodellung bei der Credit Suisse: Die Schwerpunkte lagen sowohl auf der sprachlichen Normierung als auch darin, eine zentrale Version durch die bereichsspezifische dezentrale Lösungen anzureichern. Bei den lokalen Wissensmanagern konnte ein Bewusstsein für die bereits vorhandenen Begriffe und Lösungen geschaffen werden.
Verteilte Prozessmodellierung bei der Bausparkasse Deutscher Ring:
Mit mehreren Gruppen von Studenten der FH Brandenburg wurde gezeigt, wie durch die Nutzung eines branchenspezifischen Semantic Web Abstimmungsprozesse und Terminologiearbeit unterstützt werden können.

1 Einführung

Das „Next Generation Internet“ bzw. „Semantic Web“, ist ein neuer Internet-Layer, der eine verteilte Modellierung von Inhalten bestehender Webseiten ermöglicht. Dabei werden nicht mehr nur Texte, sondern analog zu Whiteboard-Images oder Skizzen, Modelle mit den wichtigsten Zusammenhängen abgelegt. Auf diese Weise entstehen bei Verwendung normierter Ontologien durch die formalisierte Darstellung der Inhalte ganz neue Suchmöglichkeiten. Ambiente („unmerklich in ihre Umgebung eingebettete“) intelligente Anwendungen und Agenten können dieses Wissensnetz auf vielfältige Weise nutzen.

Das Semantic Web befindet sich derzeit noch im Anfangsstadium. Von vielen Seiten werden große Möglichkeiten in seinem weiteren Aufbau gesehen, konkrete Anwendungen sind jedoch derzeit noch sehr selten. Die Definition von XML-Protokollen wie RDF, RDFS und DAML+OIL durch das W3C lassen eine größere Verbreitung erwarten, so dass in Zukunft mit einer zunehmenden Anzahl von Anwendungen im Semantic Web zu rechnen ist.

Diese neue Technologie wird sich unserer Erfahrung nach zunächst innerhalb der Intranets größerer, verteilter Unternehmen ausbreiten, da hier ein großer Bedarf zur Abstimmung der Strukturen von Knowledge Management-Systemen zwischen den verschiedenen Unternehmensteilen besteht, welcher durch die Technologien des Semantic Web befriedigt werden kann. Die Schaffung zentraler Begriffskontexte bzw. Ontologien und Prozessmodelle ist dazu eine wesentliche Voraussetzung.

Mit SemTalk steht ein einfach zu bedienender Editor für Semantic-Web-Ontologien und Prozesse auf der Basis von MS Visio zur Verfügung. SemTalk basiert auf einem offenen, graphisch konfigurierbarem Meta-Modell, so dass es leicht an verschiedene, insbesondere auch prozessorientierte, Modellwelten wie EPKs oder Bonapart-Modelle anzupassen ist. Die Modelle stehen den räumlich und zeitlich verteilten Benutzern mit Hilfe von MS Office XP SmartTags bei der täglichen Arbeit mit Word, Excel oder Outlook im direkten Zugriff zur Verfügung.

Im Folgenden werden zwei praktische Anwendungen der Semantic Web Technologie in Real-Life-Projekten vorstellt: Zielstellung des ersten Projekts war eine abteilungsübergreifende Informationsmodellierung bei der Credit Suisse, wobei sowohl eine sprachliche Normierung erreicht als auch eine zentrale Version durch bereichsspezifische dezentrale Lösungen angereichert werden sollte.

In dem zweiten Projekt ging es um eine verteilte Prozessmodellierung bei der Bausparkasse des Deutschen Rings. Hier wurde mit mehreren Arbeitsgruppen aus Studenten der FH Brandenburg gezeigt, wie sich durch die Nutzung eines branchenspezifischen Semantic Web Abstimmungsprozesse und Terminologie-arbeit unterstützen lassen.

2 Abteilungsübergreifende Informationsmodellierung bei der Credit Suisse

Im Rahmen dieses Projekts wurde in mehreren Workshops die Grundlage für ein wachsendes visuelles Glossar als mögliche Basis eines Wissensmanagement-Systems gelegt. Die Workshopergebnisse wurden abei in Form von Konzeptmodellen zusammengefasst und im Intranet zur Verfügung gestellt.

2.1 Ausgangssituation

In heutigen Großunternehmen herrscht durch den schnellen technologischen Wandel einerseits, andererseits durch die nach Zusammenschlüssen mit anderen Unternehmen entstehende Situationen eine große Sprachvielfalt vor. Besonders deutlich wird dieses im IT-Bereich, wo eine große Zahl von Architekturbeschreibungen, Strategiepapieren, Technologiekonzepten usw. vorliegt. Das darin enthaltene Wissen ist trotz der expliziten textuellen Ausarbeitung oft sehr stark an Einzelpersonen gebunden und kann nur schwer zusammengeführt werden. Typisch ist das häufige Auftreten von Homonymen, also die Benutzung derselben Worte für unterschiedliche Begriffe. Andereseits finden sich in der immer noch recht jungen Informatik aber auch viele Synonyme, bzw. synonym verwendete Worte, die in der nächsten Abteilung schon wieder eine ganz andere Bedeutung haben können.

2.2 Ziele des Projekts

In dem Projekt sollte eine Infrastruktur und ein praktisch nutzbares Basisvokabular ausgearbeitet werden, mit denen bestehende Dokumente sprachlich vereinheitlicht werden können. Entstehende Glossare bzw. Modelle sollten generell in einer möglichst flexibel wieder verwendbaren Form repräsentiert werden, um sie später leicht auch in technischen Applikationen wie Document Management- und Content Management Systemen einsetzen zu können. Eine weitere Anwendung ist die automatische Dokumentenklassifikation.

Der Schwerpunkt in diesem Projekt lag auf einerseits auf der sprachlichen Normierung und andererseits darin, eine zentrale Version eines Glossars durch bereichsspezifische dezentrale Lösungen anzureichern. Es ging nicht darum, dogmatisch zentrale Vorgaben zu erlassen, sondern beim lokalen Wissensmanager oder Modellierer ein Bewusstsein für die bereits vorhandenen Begriffe und Lösungen zu schaffen („Awareness“). Um eine dauerhafte Umsetzung in die alltägliche Praxis zu gewährleisten, musste auch bei den Anwendern ein Bewusstsein über bereits vorhandene Kontexte erzeugt werden, indem in ihren täglichen Anwendungen auf die grundlegenden Begriffsdefinitionen und Modelle Bezug genommen wurde. Auch hier ging es nicht um einen Zwang zur Anwendung der definierten Begriffe, sondern um die Schaffung von Awareness, z.B. durch die Integration mit Office XP.

Es war von Projektbeginn an eine zentrale Forderung, dass das Glossar im Intranet in einer für verschiedene Benutzer geeigneten Form dargestellt werden muss. Aus dieser Anforderung lässt sich ableiten, dass keine komplizierten technischen Notationen wie z.B. UML-Diagramme genutzt werden sollten.

Generell sollte dabei ein möglicher Grundstock für das zukünftig aufzubauende Wissensmanagement-System gelegt werden. Insbesondere das "Bootstrapping" eines solchen Systems ist immer ein sehr aufwendiges Vorhaben. Ist initial zu wenig Inhalt vorhanden, wird das System wenig genutzt und fängt dann auch nicht von allein an zu leben. Versucht man hingegen eine vollständige Ontologie aller im Unternehmen existierenden Objekte zu erstellen, wird man einerseits nie fertig und läuft zum anderen Gefahr, dass die dabei entstehende "Normsprache" mit der sich schnell verändernden Welt des Anwenders wenig zu tun hat.

Deshalb ist es essentiell, zunächst eine hinreichende Basis an Inhalt bzw. Definitionen zu schaffen und dann jedem einzelnen Benutzer die Möglichkeit zu geben, sein Wissen im System zu publizieren in der Hoffnung, dass das System sich dann selbst mit Inhalt füllt. Dieses setzt natürlich leicht zu bedienende und in Office integrierte Werkzeuge voraus. Ähnlich wie beim Erstellen und Indizieren von textuellen Webseiten muss es auch hier gelingen, an das Bedürfnis zur Selbstdarstellung zu appellieren.

Innerhalb dieses Projektes wurden jedoch zunächst nur die Schaffung und Modellierung eines Glossars angestrebt.

2.3 Ein Semantic Web als Wissensmanagementsystem

Das Glossar besteht aus Begriffen mit Definitionstexten und Synonym-/ Homonym-Beziehungen. Da es daneben aber auch explizite Beziehungen zwischen den Begriffen und Klassifikationen in Ober- und Unterbegriffe gibt, bietet sich die formalisierte Darstellung als Modell an. Neben Topic Maps ist die W3C Recommendation RDFS auf der Basis von XML ein geeigneter Standard, um Informationsmodelle flexibel abzulegen.

Als graphischer Editor wird SemTalk eingesetzt. Mit Hilfe von SemTalk und RDFS können die Modelle wie HTML-Webseiten einzeln im Intranet abgelegt und mit Hyperlinks verbunden werden. Diese Art der Wissensrepräsentation erfordert keine zentrale Pflegeorganisation für das Gesamtmodell, sondern kommt mit einer koordinierten Abstimmung der Kernbegriffe aus.

Abbildung 1: Ausschnitt aus einem SemTalk-Modell

Die Konsistenz zwischen den verschiedenen Teilmodellen wird während der Modellierung durch den SemTalk Konsistenz Wizard gewährleistet. Der Wizard weist den Benutzer darauf hin, dass ein bestimmter Begriff schon in einem anderen Modell verwendet wurde. Statt denselben Begriff noch einmal zu modellieren, wird in diesem Fall ein Hyperlink auf den "Referenz"-Begriff gebildet. Der SemTalk Wizard nutzt dabei Indextabellen, die vom SemTalk RDFS Crawler errechnet wurden. Dieser Crawler erstellt ein Verzeichnis des verfügbaren Wissens in ausgewählten Bereichen von Intranet, Internet und Filesystem.

Diese Indextabellen werden auch beim Arbeiten mit MS Office genutzt. SemTalk SmartTag ist eine Technologie, die die Texte beim Schreiben analysiert und die Worte markiert, die im Glossar als Referenzbegriff oder Synonym enthalten sind. Gefundene Synonyme können bei Bedarf mit den Referenzbegriffen ausgetauscht werden. Die Definitionen der erkannten Worte stehen mit einem "Klick" sowohl im Visio Modell als auch als HTML Darstellung zur Verfügung. Auf diese Weise kommt es zu erheblichen Einsparungen bei der aufwendigen manuellen Überarbeitung der Texte.

Mit Hilfe der SemTalk Tool-Suite lassen sich auch gezielte Hinweise auf zu überarbeitende Dokumente und Textstellen erzeugen.

Zur Erstellung spezifischer Modelle, z.B. zur Darstellung detaillierter Zusammenhänge aus einzelnen Dokumenten, die nicht in das allgemeine Glossar eingehen sollen, wird SemTalk an den Arbeitsplätzen bei der Überarbeitung eingesetzt. Die dabei entstehenden Modelle einzelner Dokumente oder Fachgebiete erweitern bzw. spezialisieren das allgemeine Glossar. D.h. jeder neu auftauchende Begriff wird in den Kontext der bestehenden Begriffe eingeordnet. Bei Suchläufen mit allgemeinen Oberbegriffen werden auch diese neuen Modelle mit ihren spezialisierten Begriffen einbezogen.

Falls bei der Überarbeitung einzelner Dokumente neue Begriffe für das allgemeine Glossar auftauchen, werden diese dann nach Abstimmung in das allgemeine Glossar eingearbeitet.

Die Initialisierung eines Wissensmanagementsystems geschieht i. A. durch Workshops, meist mit Experteninterviews. Signifikante Einsparungsmöglichkeiten ergeben sich hier durch die Möglichkeit der Terminologieextraktion mit Hilfe des Concept Composers.

Der Concept Composer wird eingesetzt
zur Suche in größeren Textmengen (Quelltext + Kollokationen) im Einsatz zusammen mit SemTalk zur Ermittlung relevanter Fachbegriffe sowie zugehöriger Kollokationen
als Informationssystem "Concept Presenter" im Intranet mit graphischer Oberfläche, ggf. integriert in den HTML Viewer von Semtalk.

Abbildung 2: Verbindung mit dem Concept Composer

Mit dem SemTalk Glossary Glossary können verschiedene Versionen von Definitionen verwaltet, Synonym-/Homonym-Zuordnungen getroffen und Textstellen gesucht werden. Das SemTalk Glossary stellt dabei die Schnittstelle zwischen SemTalk und dem Concept Composer her.

2.4 Vorgehensweise beim Bootstrapping:

- Erstellung einer Liste zentraler, prioritär zu definierender Begriffe

- Einlesen von 100 repräsentativen Dokumenten in den Concept Composer (Fa. TextTech). Ergebnisse sind zum einen eine "Hitliste" von wichtigen Fachwörtern und zum anderen eine Infrastruktur zum Suchen von Textstellen und Kollokationen, also häufig im Satz zusammen verwendeten Wortpaaren. Der Composer wurde zunächst extern als ASP-Lösung eingesetzt.

- Durchführung von drei Workshops mit 3-5 Tagen mit bis zu fünf Experten. Während des Workshops wird zur Dokumentation und Verwaltung von Begriffsdefinitionen das SemTalk Glossary eingesetzt.

Abbildung 3: SemTalk Glossary

Am Ende eines jeden Workshop-Tages werden die untersuchten Szenarien dann graphisch in SemTalk modelliert, da dies während des Workshops selbst in der Regel nur rudimentär gelingt. Die graphischen Modelle vereinfachen den Diskussionsprozess dann aber entscheidend. Die Beziehungen können visualisiert und navigiert werden. Homonyme werden im Bild gegenüber gestellt.

Am Ende der Workshops sind die zentralen Begriffe definiert und graphisch modelliert. Das Glossar steht nach der Modellierung mit der Graphik im Intranet zu Verfügung.

2.5 Der Knowledge Management-Prozess

Das Glossar wird in seiner Initialform im Intranet zur Verfügung gestellt. Ein periodisches Audit über den Inhalt gewährleistet die Aktualität und den Nutzen. Änderungsanforderungen werden dabei zentral gesammelt und in regelmäßigen Abständen zwischen den Abteilungen abgestimmt. Das Update des Modells wird auf Basis der Abstimmungsergebnisse durchgeführt. Die Verantwortung für die Durchführung dieses Prozesses liegt dabei bei den Intranet-Verantwortlichen.

2.6 Ergebnisse des Projekts

Innerhalb von sieben Tagen Workshop, verteilt auf drei Monate, wurden die 200 vordringlichen Begriffe der beteiligten Abteilungen definiert und im Anschluss in ca. zwei Tagen modelliert. An den Workshops waren rollierend ca. 10 Personen beteiligt. Der Aufwand für den einzelnen Mitarbeiter lag zwischen zwei Stunden und drei Tagen. Damit konnte in sehr kurzer Zeit der zähe Prozess der Begriffsabstimmung effizient durchgeführt werden. Die Unterstützung durch das SemTalk Glossary Glossary war dazu eine notwendige Voraussetzung.

Die Ergebnisse werden im Intranet publiziert und periodisch aktualisiert. Die Modellierung mit SemTalk ermöglicht einen Zugang zu einzelnen Begriffen über verschiedene Kontexte. Die grafische Darstellung erhöht die Handhabbarkeit und das Begriffsverständnis, da bei der Suche nach einem spezifischen Begriff der zugehörige Kontext mit erfasst werden kann.

Mit Hilfe des Projekts wurden Effizienz und Effektivität der Kommunikation zwischen den Mitarbeitern der verschiedenen Abteilungen gesteigert. Zusätzlich wurde der Grundstein gelegt für eine zielgerichtete Überarbeitung von Dokumentationen, indem deutlich wird, welche Dokumente angepasst werden müssen, wenn sich zentrale Begriffskontexte verändern.

2. 7 Ausblick

Das für Credit Suisse erstellte Glossar wird derzeit erprobt. Bei erfolgreicher Probe wird die Ausweitung der Methode auf andere Abteilungen bis hin zum gesamten Unternehmen erfolgen.

3 Verteilte Prozessmodellierung bei der Deutscher Ring Bausparkasse

Hauptziel dieses mehrwöchigen Projekts mit Studenten der Fachhochschule Brandenburg war die Modellierung.der Antragsbearbeitung bei der Deutscher Ring Bausparkasse.

Ein wesentlicher Unterschied zu konventionellen Prozessmodellierungsprojekten bestand dabei darin, dass durch die Nutzung eines branchenspezifischen Semantic Web Abstimmungsprozesse und Terminologiearbeit effizienter durchgeführt werden konnten.

3.1 Rahmenbedingungen und Ziele

Es wurden mit zwei getrennten Gruppen alle in zwei vorgegebenen Abteilungen vorkommenden Geschäftsprozesse modelliert. Jeder Abteilung war eine vierköpfige Studentengruppe zugeordnet, welche die Prozesse ihrer Abteilung systemanalytisch erfasste und anschließend in SemTalk parallel modellierte. Darüber hinaus wurden den IST-Prozessen SOLL-Prozesse gegenüber gestellt, welche die Wünsche der Mitarbeiter einer jeden Abteilung und deren Umsetzbarkeit stärker berücksichtigten.

Die primären, durch den Kunden vorgegebenen Ziele waren die Schaffung von mehr Transparenz im Unternehmen sowie die Vorbereitung der Einführung eines Workflow-Management-Systems.

Ein wesentliches Projektziel bestand aber auch darin, den verteilten Modellierungsprozess selbst zu untersuchen. Es sollte herausgefunden werden, wie sich die Kommunikation innerhalb der Modellierungsteams und mit den Anwendern verbessern lässt.

Eine Erfahrung aus vielen GPO-Projekten besteht darin, dass für einequalitativ hochwertige verteilte Modellierung ein Modellierungswerkzeug mit einem gemeinsamen Repository nicht ausreichend ist. Ein solches Repository stellt im besten Falle die syntaktische Konsistenz der Modelle sicher, indem es die Prozessschnittstellen verwaltet. Es liefert aber praktisch keine Hilfe beim Kernproblem, der Schaffung einer gemeinsame Begrifflichkeit für Aufgaben, Prozesse und Informationen. Diese Problematik wird um so wichtiger, wenn unternehmensübergreifende Prozesse, z.B. im B2B Bereich, erarbeitet werden, da die verschiedenen Geschäftspartner zunächst ihre "Unternehmenssprachen" mit einander verbinden müssen.

3.2. Vorgehen bei der Prozess-Modellierung mit SemTalk

Die wichtigste Philosophie des Internets und damit auch des Semantic Web ist es Informationen nicht zu kopieren sondern zu referenzieren. Durch den Link auf eine andere Webseite verändert man deren Inhalt nicht. Das flexible Informationssystem, das auf diese Weise entsteht, hat sicherlich nicht die Konsistenz einer Datenbank, hat dafür aber die Chance dynamisch zu wachsen. Mit SemTalk wird also nicht ein einzelnes Modell sondern ein Netz von miteinander verlinkten Modellen erstellt. Während das Semantic Web primär den Fokus auf reine Wissensrepräsentation legt, also die Modellierung von Informationsklassen wie im Fall Credit Suisse, können mit SemTalk auch Prozessmodelle als „Web“ angelgt und verwaltet werden.Verlinkt werden die Modelle untereinander aber auch mit externen Modellen wie zum Beispiel branchenspezifischen Standards.

Das Vorgehen bei der Prozessmodellierung mit einem Semantic Web besteht im wesentlichen aus drei Schritten:

Auswahl geeigneter Referenzbiliotheken im Internet
Customizing dieser Bibliotheken für den Projektbedarf
Erstellung der Prozessmodelle vor dem Hintergrund der Referenzmodell

3.2.1. Das Semantic Web liefert die Referenzmodelle

Unsere Vorgehensweise besteht im Wesentlichen darin, schon im Internet bzw. Semantic Web vorhandene Referenzmodelle zu nutzen, diese in einer dem Anwender verständlichen Form aufzubereiten und sie dann für den zu modellierenden Problembereich anzupassen. Es gibt eine zunehmende Zahl von Organisationen die solche Modelle erstellen:

http://www.dmtf.org develops Ontologies for the Telecommunication Industry
http://www.bpmi.org develops a Process Ontology for Representing Business Processes
http://www.papinet.org develops global transaction standards for the paper supply chain.
http://www.hr-xml.org is dedicated to the development and promotion of standardized XML vocabularies for human resources (HR).

Es werden dabei zur Zeit noch verschiedene XML basierte Sprachen genutzt. Populäre Repositories aus dem EAI Bereich sind BizTalk www.biztalk.org , RosettaNet u.a.

Allgemeine Begriffssysteme auf XML Basis findet man bei www.cyc.com und mit Wordnet bei www.xmlns.com

Diese Referenzmodelle können natürlich auch die Quelltextanalyse wie im ersten Teil beschrieben erweitert werden.

3.2.2 Prozessmodellierung

SemTalk unterstützt verschiedene Methoden zur Modellierung von Geschäftsprozessen, wobei sich zur Darstellung von unternehmensübergreifenden Prozessen die PROMET-Methode der IMG nach Österle (http://prometatweb.img.com/) anbietet. In dem vorliegenden Projekt mit seinem starken Fokus auf innerbetriebliche Abläufe wurde jedoch die SemTalk-Version für die Methode Kommunikations-Struktur-Analyse nach Krallmann (http://www.sysedv.cs.tu-berlin.de/Homepage/SYSEDV.nsf/) gewählt, da diese bei den Studenten schon aus der Verwendung des GPO-Tools Bonapart bekannt war.

In der KSA und damit auch in Bonapart besteht ein Prozess aus Schnittstellen, Aktivitäten und verbindenden Informationsflüssen mit Information und Medien. Zu jedem dieser Basisbausteine werden im Standardfall Klassenmodelle, z.B. Aufgabenklassen und Informationsklassen, gebildet. Die Klassenmodelle helfen bei der Strukturierung und sprachlichen Konsistenz der Prozessmodelle und bilden die Grundlage für Wiederverwendung und bessere Auswertbarkeit der entstehenden Modelle. Hierbei handelt es sich zum größten Teil um Modellelemente, die aus dem Modellierungswerkzeug „Bonapart“ bekannt sind.

In der KSA und damit auch in Bonapart, besteht ein Prozess aus Schnittstellen, Aktivitäten und verbindenden Informationsflüse mit Information und Medien. Zu jedem dieser Basisbausteine sollten Klassenmodelle gebildet werden. Aufgabenklassen und Informationsklassen sind dabei die wichtigsten.

„Paginiernummer zuorden“ ist die Klasse der Aktivitäten „Paginiernummer zuorden.1“ im Prozess „AdressÄnaderung“ und aller anderen Stellen wo „Paginiernummer zuorden“ auftaucht. „Paginiernummer zuordnen“ ist als Klasse z.B. Unterklasse der Klasse „Nummer zuordnen“. Auf Klassenebene wird auch beschrieben, welche möglichen Teilaufgaben bestehen.

Die Klassenmodelle helfen bei der Strukturierung und der Erhaltung der sprachlichen Konsistenz der Prozessmodelle. Sie bilden die Grundlage zur Wiederverwendung und besseren Auswertbarkeit der entstehenden Modelle.

Mit SemTalk werden die Klassenmodelle im Semantic Web Standard RDFS beschrieben bzw werden fremde Klassenmodelle referenziert. Die Klassenmodelle können dabei top-down also durch Einigung im Workshop vor der Prozessmodellierung oder auch Bottom-Up während der Prozessmodellierung erstellt werden. Letzteres Vorgehens ist sicherlich effizienter, da es die Modellierungstiefe der Klassenmodelle einzugrenzen hilft.

Erst über die Objekte und dann über die Abläufe nachzudenken empfiehlt sich aber zumindest in der Anfangsphase um eine konsistente Basis zu schaffen. Wichtig ist, dass die Klassenmodelle über die verschiedenen Teilprojekte hinweg konsistent sind. Dann ist es auf einfache Weise möglich die entstandenen Teilmodelle und Prozesse wieder zu integrieren.

3.2.3 Ein Beispiel

Zum besseren Verständnis der verteilten Modellierung mit SemTalk sei im Folgenden der einfache Prozess "AdressÄnderung" (vgl. Abildung 4) vorgestellt. Die Aktivität "Paginiernummer zuordnen" ist dabei von besonderem Interesse, da diese Aktivität vom anderen Team als (Unter-)Prozess modelliert wurde. "Paginiernummer zuordnen" ist somit die Klasse der Aktivität "Paginiernummer zuordnen.1" im Prozess "AdressÄnderung", aber auch die aller anderen Aktivitäten bzw. Prozesse, in denen "Paginiernummer zuordnen" auftaucht. "Paginiernummer zuordnen" ist als Klasse gleichzeitig eine Unterklasse, z.B. der Klasse "Nummer zuordnen". Auf Klassenebene wird u.a. beschrieben, welche möglichen Teilaufgaben es geben kann .

In unserem Beispiel findet SemTalk in dem Moment, in dem der Modellierer "Paginiernummer zuordnen" als Name einer Aktivität formuliert, diese Aktivität als schon modellierte Klasse in dem Modell der anderen Gruppe und bietet dem Anwender deren Übernahme und gegebenenfalls Anpassung an. Auf´diese Weise war es (wie auch in anderen Fällen) möglich, die vom anderen Team modellierten Inhalte zu nutzen.

Abbildung 4: Beispielprozess „AdressÄnderung“

3.2.4 Toolunterstützung durch SemTalk bei der Modellierung

SemTalk unterstüzt den Benutzer während der Modellierung durch Wizards, die den Modellierungprozess überwachen und Hinweise geben können. Diese Wizards sind im Prinzip autonome Agenten die selbständig die Veränderung des Modells nach ihnen vorgegeben Regeln überwachen können. Diese reicht von der Schreibweise z.B. Gross/Kleinschreibung über das Erkennen von Synonymen bis hin zur Untersuchung verdächtiger Fälle von die Vererbunghierachie falsch erscheint. Ein weiterer Agent ist in Office XP eingebettet und untersucht dabei jeden Satz der geschrieben wird daraufhin ob modellierte Worte verwendet wurde.

Zur Animation werden der Agenten wird das aus MS Office bekannte Agententoolkit verwendet. Unterstüzt werden die Agenten durch Crawler, die selbständig oder auf Anforderung hin nach vorhandenen Modellen suchen und daraus Index-Dateien für die Agenten erstellen. Die Crawler suchen dabei nicht nur im lokalen Filesystem sondern auch im Semantic Web nach verfügbaren Wissensquellen im Format RDFS.

3.4. Verallgemeinerbare Erfahrungen aus dem Projekt

Um dem Thema dieser Publikation Rechnung zu tragen, konzentrieren wir uns hier auf die Erfahrungen bei der Modellierung mit SemTalk. Dabei sei auch auf einige vorteilhafte Features dieses Systems eingegangen.

1. Mit SemTalk werden die Klassenmodelle im Semantic-Web-Standard RDFS beschrieben bzw es werden fremde Klassenmodelle referenziert. Die Klassenmodelle können dabei top-down, also durch Einigung im Workshop vor der Prozessmodellierung, aber auch bottom- up, d.h. laufend während der Prozessmodellierung erstellt werden. In dem Projekt wurden beide Ansätze verfolgt: Zunächst wurden in der Anfangsphase einige grundlegende Klassen von Aktivitäten und weiterer Objekte als Klassen definiert, die dann allen Modellierern zur Verfügung standen. Während des Modellierungsprozesses wurde dann auf die effizientere bottom-up-Modellierung zurückgegriffen, da diese außerdem hilft, die Modellierungstiefe der Klassenmodelle einzugrenzen.

2. Als besonders wichtig hat sich die Maxime erwiesen, die Klassenmodelle über die verschiedenen Teilprojekte hinweg konsistent zu halten . So war es auf einfache Weise möglich, die entstandenen Teilmodelle und Prozesse wieder zu integrieren.