Ontologie zur Entwicklung semantischer Informationssysteme

Definition

Das Wort Ontologie setzt sich aus den altgriechischen Wörtern τὸ ὄν („das Sein“) und λόγος („Lehre“) zusammen. Entsprechend bedeutet Ontologie etwa „die Lehre vom Seienden“ bzw. „die Lehre des Seins“. In der Philosophie soll Ontologie die umfassendste aller Wissenschaften sein, da sie alles Seiende behandelt. Sie stellt ein Ordnungssystem dar und ist ein Versuch, die Welt der Dinge zu erkennen, zu benennen und zu ordnen.

In der Informatik steht Ontologie entsprechend für eine formale Repräsentation eines Realitätsausschnittes, eines Wissensbereichs oder einer Anwendungsdomäne, die von einer Maschine gelesen und interpretiert werden kann. Im Gegensatz zum philosophischen Verständnis sind Ontologien für Computersysteme also keinesfalls allumfassend, sondern hängen stark von der Anwendung und dem Wissensbereich ab. Sie werden entwickelt, um spezifische Fragestellungen in ihrem definierten Wissensgebiet automatisiert zu beantworten. Eine Ontologie ist also eine Form der Wissensorganisation. Sie dient dem Ziel, die Bedeutung von Informationen zu definieren, damit Maschinen damit arbeiten und einen Mehrwert bieten können, indem sie implizites Wissen sichtbar machen.

Einsatz von Ontologien in semantischen Anwendungen

Ein wichtiger Einsatzbereich von Ontologien sind sogenannte semantische Anwendungen. Hierbei kann es sich um verschiedenste Systeme handeln, die jedoch alle eine Suchfunktionalität beinhalten, die auf Ontologien basiert. Da in Ontologien nicht nur Begriffe, sondern auch deren Synonyme, Beziehungen etc. definiert sind, decken semantische Anwendungen auch unscharfe Suchen nach verwandten Begriffen ab. Damit gehen sie weit über die Möglichkeiten einer Volltextsuche hinaus. Denn das System nutzt bei der Bereitstellung von Informationen die Bedeutung (= die Semantik) der gesuchten Begriffe und gleicht sie mit dem Wissen ab, das in der Ontologie – und ggf. in weiteren verknüpften Ontologien – modelliert wurde. Denn es gilt: Je mehr Ontologien innerhalb der semantischen Anwendung sinnvoll miteinander vernetzt sind, desto breiter das Wissen, das abgerufen werden kann.

Für eine Vernetzung müssen die Ontologien interoperabel sein. Im besten Fall werden sie daher nach standardisierten Technologien sowie normierten Benennungen und Bedeutungen entwickelt. Über das Internet lassen sie sich dann vernetzen und so innerhalb einer webbasierten Anwendung gemeinsam nutzen.

Eine Vernetzung ist zwar auch möglich, wenn die Ontologie nicht standardisiert modelliert wird, in diesem Fall ist es aber aufwendiger, Interoperabilität zu gewährleisten. Da die Benennungen etc. nicht einheitlich sind, muss zuvor eine Zuordnung (ein sog. „Mapping“) stattfinden, damit die verknüpften Ontologien einander „verstehen“.

Die standardisierte Entwicklung bzw. das Mapping erlauben eine umfassende Vernetzung der eigenen Ontologie. Denn im Kontext des Semantic Web, d. h. dem vernetzten Internet der Daten, stehen viele Ontologien öffentlich zur Verfügung (siehe Linked Open Data). Durch die Verknüpfung mit ihnen können in einem Wissensgebiet weiterreichende Suchanfragen beantwortet werden, ohne dass die zusätzlichen Informationen in der eigenen Ontologie modelliert werden müssen.

Anwendungsfall steht im Mittelpunkt der Entwicklung einer Domänenontologie

Eine Ontologie, die zur Wissensrepräsentation innerhalb eines wissensbasierten Computersystems genutzt wird, muss praktischen Nutzeranforderungen genügen. Daher sind im Vorfeld der Entwicklung konkrete Fragen zu beantworten:

Welcher Ausschnitt der Realität/des Wissensgebiets soll abgebildet werden?
Welchem Zweck soll die Ontologie dienen? D. h. welche Fragestellungen sollen beantwortet werden?
Welche Anwendungsfälle sollen betrachtet werden?
Welche Anforderungen werden an die Ontologie gestellt?
Welchen Nutzen soll die Ontologie – auch zukünftig – haben?

Die Antworten auf diese Fragen bestimmen, welchen Umfang die Ontologie hat. In der Folge wird eine Domänenontologie entwickelt, die genau die Sachverhalte abbildet, die für die individuellen Anforderungen relevant sind.

Aufbau einer Ontologie – formale Darstellung von Wissen

Für das definierte Fach- bzw. Anwendungsgebiet, das die Ontologie darstellen soll, werden bestimmte Elemente formal definiert, d. h. in einer Sprache, die Computer verarbeiten können:

Relevante Begriffe/Konzepte
Eigenschaften/Merkmale (Attribute) der relevanten Begriffe/Konzepte
Beziehungen zwischen den relevanten Begriffen/Konzepten
Gültigkeitsregeln für die Beziehungen

Eine Ontologie setzt sich dann aus zwei Ebenen zusammen:

Die Ebene des abstrakten Schemas, in dem Klassenhierarchien, deren Beziehungen untereinander und Regeln definiert werden (Bsp. aus Abb. 1: „Scheinwerfer“ ist eine Komponente von „Pkw“)
Die Ebene der Fakten, auf der die konkreten Individuen mit ihren Eigenschaften und Beziehungen untereinander abgebildet werden (Bsp. aus Abb. 1: „Scheinwerfer_Hela_B15“ ist eine Komponente von PKW „F-FF-7777“ – das ist ein Fakt)

Damit die Informationen auf beiden Ebenen durch Maschinen les- und interpretierbar sind, müssen sie formal definiert werden. Dafür gibt es Standardsprachen, z. B. RDF/RDFS oder OWL (Web Ontology Language), die vom internationalen Gremium zur Standardisierung der Technologien im World Wide Web (W3C – Word Wide Web Consortium) entwickelt wurden. Die verschiedenen Sprachen sind unterschiedlich mächtig. Sie decken verschiedene Schwerpunkte ab und können gemeinsam innerhalb einer Ontologie verwendet werden.

Dieser Einsatz standardisierter Sprache in der Entwicklung von Ontologien für webbasierte Anwendungen trägt dazu bei, dass die Ontologien interoperabel sind und sich miteinander vernetzen lassen.

Klare Abgrenzung des Wissensgebiets

Eine Ontologie, die für einen konkreten Anwendungszweck entwickelt wird, bildet nur einen bestimmten, abgegrenzten Wissensbereich ab. Daher sollten nur Begriffe/Konzepte aufgenommen werden, die für diesen Anwendungszweck relevant sind. So muss bei einer Ontologie für das Bankwesen nicht definiert werden, dass ein Kunde/eine Kundin ein Mensch und ein Mensch ein Lebewesen usw. ist. Dieses Wissen hier zu modellieren, würde einen unnötigen Mehraufwand bei der Entwicklung und späteren Pflege bedeuten.

Zudem ließe sich dieses Wissen bei Bedarf über eine schon existierende Ontologie zur Klassifikation der Lebewesen ableiten. Hierfür würde in der Bankwesen-Ontologie auf die Lebewesen-Ontologie referenziert.

Die Bedeutung der Terminologie

Nachdem die relevanten Begriffe/Konzepte einmal festgelegt sind, spielt Terminologie bei der Entwicklung einer Ontologie eine zentrale Rolle: Es gilt festzulegen, welche Benennungen zu den jeweiligen Begriffen/Konzepten genutzt werden sollen. Zusätzlich müssen die festgelegten Benennungen verglichen, differenziert und von ähnlichen Benennungen abgegrenzt werden. Dabei ist es für die Qualität der späteren Verarbeitung entscheidend, dass die Ontologie auch unterschiedliche Verwendungen eines Ausdrucks abbildet, die innerhalb des Wissensgebiets vorkommen können. Auch Veränderungen in der Bedeutung eines Ausdrucks im Laufe der Zeit sowie regionale Unterschiede in der Benennung eines Konzepts sollten berücksichtigt werden.

Transparente Modellierung der Terminologie in einem Wortnetz zur Klärung der Fachtermini in der Ontologie

Ontologie als Methode der künstlichen Intelligenz

Eine Ontologie zur formalen und maschineninterpretierbaren Wissensrepräsentation ist eine Methode der wissensbasierten künstlichen Intelligenz (KI) und somit ein Teilgebiet der KI. Ontologien dienen dazu, einer Anwendung Wissen so zur Verfügung zu stellen, dass diese in der Lage ist, Antworten auf komplexe und „unscharfe“ Nutzerfragen zu liefern. Hierfür läuft eine Inferenzmaschine über die Ontologie, die aus dem formalisierten Wissen logische Schlussfolgerungen zieht.

Die Inferenzmaschine arbeitet dabei auf der Grundlage von in der Ontologie definierten Gültigkeitsregeln. Hier gibt es gängige Regeln, es können aber auch eigene formuliert werden, die für das betreffende Wissensgebiet spezifisch sind. Ein einfaches Beispiel für eine solche Regel ist die Transitivitätsregel. Sie besagt: Wenn X zu einer Klasse B gehört und diese Klasse B eine Unterklasse von Klasse A ist, dann gehört X auch zur Klasse A. Die Transitivitätsregel hat damit zur Folge, dass Eigenschaften über die Klassenhierarchie nach unten vererbt werden.

Wenn also in Abb. 1 „Pickup“ eine Unterklasse von „LKW“ ist und wenn „LKW“ wiederum eine Unterklasse von „Fahrzeug“ ist, dann lässt sich anhand der Transitivitätsregel schlussfolgern, dass „Pickup“ eine Unterklasse von „Fahrzeug“ ist. Die Unterklasse „Pickup“ erbt sowohl die Eigenschaften der Klasse „Fahrzeug“ als auch ggf. die zusätzlichen Eigenschaften der Unterklasse „PKW“.

Die Inferenzmaschine kombiniert die verschiedenen Regeln und erarbeitet Schlussfolgerungen so schneller und gründlicher als ein Mensch. Sie kann aber nur richtig ableiten und schlussfolgern, wenn der Mensch bei der Modellierung sorgfältige Vorarbeit geleistet hat. Sind Regeln unzureichend definiert, Begriffe oder Beziehungen innerhalb der Ontologie mehrdeutig oder nicht klar abgegrenzt, kommt die Inferenzmaschine möglicherweise zu falschen Schlussfolgerungen oder kann keine sinnvollen Ergebnisse liefern. Daher ist es entscheidend, das Wissensgebiet vorab klar zu definieren und eindeutig zu modellieren. Sind diese Voraussetzungen erfüllt, entfaltet die Ontologie im Zusammenspiel mit der Inferenzmaschine ihre mächtige wissensbasierte „künstliche Intelligenz“ und kann neues (implizites) Wissen generieren.

Vorteile im Überblick – Ontologie schafft Mehrwert

Klare Darstellung des Wissensgebiets
Ziel einer Ontologie zu einem Wissensgebiet ist dessen normierte Benennung und Ordnung. Daher ist die resultierende Modellierung eine klare Darstellung des Wissensgebiets. Damit bildet sie die Grundlage für ein gemeinsames Verständnis und kann zu einer transparenten Kommunikation beitragen.
Transparenz durch Normierung
Die Modellierung einer Ontologie „zwingt“ zur Normierung von Benennungen, um deren Bedeutung und Beziehungen zu anderen Benennungen klar zu definieren. Dies trägt zur Transparenz der Darstellung und auch zu einem einheitlichen Verständnis bei.
Schlussfolgerungen bringen Mehrwert
Die Wissensrepräsentation einerseits und die logische Verarbeitung dieses Wissens durch Computersysteme andererseits ermöglichen es Ontologien, aus der Bedeutung (Semantik) von Informationen Schlussfolgerungen zu ziehen. Damit können sie auch neues Wissen generieren, das nicht modelliert wurde, sondern nur implizit vorhanden ist.
Informationsbereitstellung passend zu Kontext und Zweck
Wissensbasierte Informationssysteme, deren Intelligenz auf Ontologien basiert, sind in der Lage, Nutzer*innen mit Informationen aus komplex vernetztem Wissen zu versorgen. Dabei werden der jeweilige Kontext und/oder der gewünschte Zweck berücksichtigt.
Möglichkeit der Vernetzung
Wenn Ontologien auf der Grundlage von Standardtechnologien sowie normierten Benennungen und Bedeutungen entwickelt werden, lassen sich verschiedene Domänenontologien miteinander vernetzen. Dies ermöglicht die Beantwortung weiterreichender Suchanfragen ohne zusätzliche Modellierung.

Weiterführende Informationen

Busse et al. 2014: Was bedeutet eigentlich Ontologie? Informatik Spektrum 37(4). August 2014 – abrufbar unter https://www.researchgate.net/publication/257394004_Was_bedeutet_eigentlich_Ontologie

Cookie	Dauer	Beschreibung
cookielawinfo-checbox-analytics	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Analytics".
cookielawinfo-checbox-functional	11 months	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checbox-others	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Other.
cookielawinfo-checkbox-necessary	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookies is used to store the user consent for the cookies in the category "Necessary".
cookielawinfo-checkbox-performance	11 months	This cookie is set by GDPR Cookie Consent plugin. The cookie is used to store the user consent for the cookies in the category "Performance".
viewed_cookie_policy	11 months	The cookie is set by the GDPR Cookie Consent plugin and is used to store whether or not user has consented to the use of cookies. It does not store any personal data.