TORNADO

Tornado bildet Kriterien gegenüber heterogenen Datensätzen anhand semantischen Webtechnologien ab. Der Kern von der Plattform wird es ermöglichen, diese auszuwerten und Vorschlägen zu generieren, womit sich der Datenbestand verbessern lässt: sei es durch die Vervollständigung von fehlenden Beziehungen oder durch die Eingabe zusätzlicher Information.

Tornado

Formulierung von Qualitätskriterien mit Ontologien der OWL Sprache

Mit einer Ontologie lassen sich die Bedeutungen und Beziehungen von Begriffen formal festhalten. Das Vokabular einer Ontologie lässt sich wiederverwenden und ist somit die Grundlage der anderen semantischen Webtechnologien (s.u.). Ferner verfügen sie über ausdrucksmächtigere Konstrukte, womit die Anforderungen der Daten besser als mit konventionellen Modellierungssprachen präzisieren werden können. Gleichzeitig sind sie besser geeignet den Herausforderungen der Datenintegration zu entsprechen.

Im Tornado wird ein Datensatz in OWL ausgedrückten Aussagen unterstellt. Anders wie beim ähnlichen Ansätzen des Standes der Technik, werden Verletzungen der Datenqualität semantisch annotiert, um einen Bezug zu der Endandwendug herzustellen.

SWRL Regeln

Mit SWRL Regeln lassen sich semantische Verknüpfungen automatisch durch ein Reasoner herstellen. Innerhalb von Tornado werden sie allerdings als Qualitätskriterien verstanden. Prädikate innerhalb des Antezedens-Teils der Regeln werden untersucht, um mögliche Lücken in den Daten zu entdecken. Die Konsequenz-Teile der Regeln dienen zur Herstellung von einem Bezug zu der Endanwendung.

SPARQL Anfragen

SPARQL ist die Anfragesprache des semantic Webs. Anhand Graphmustern werden Ausschnitte des Datenbestands selektiert, geordnet und filtriert. Tornado sieht ein Modul zur Verarbeitung der Graphmuster vor, womit sich der Datenbestand automatisch prüfen lässt.