Datenqualität in un- und semi­strukturierten Daten

Datenqualitätsmessung und -maßnahmen bei Wikis und Knowledge Graphen

In Unternehmen ist die Verfügbarkeit von Informationen zu einem entscheidenden Faktor geworden, der die Produktivität und Wirtschaftlichkeit nachhaltig beeinflusst. Dabei können Organisationen, die größere Datenmengen (Stichwort Big Data) intensiv nutzen, um Entscheidungen zu unterstützen, und die sich als „datengetrieben“ begreifen, signifikant bessere finanzielle und operative Ergebnisse vorweisen. Vor diesem Hintergrund stellen die in Organisationen genutzten Daten eine entscheidende Ressource dar. Zwei moderne Möglichkeiten zur Abbildung und Formalisierung von statischem und dynamischem Domänenwissen sind dabei (Enterprise) Wikis und Knowledge Graphen. Aufgrund der in diesem Kontext vorherrschenden unstrukturierten bzw. semistrukturierten Datenformate und der kollaborativen Erstellung in Unternehmen ist die Sicherstellung der Datenqualität hier für Wissenschaft und Praxis von besonderer Relevanz. Die Universität Ulm verfolgt in Kooperation mit der Universität Regensburg und der xapio GmbH dabei folgende Ziele:

  1. Entwicklung von Methoden und Metriken zur Messung der Datenqualität von Wikis und Knowledge Graphen
  2. Definition von Maßnahmen zur Verbesserung der Datenqualität von Wikis und Knowledge Graphen
  3. Entwicklung von Ansätzen zur automatisierten und qualitätsgesicherten Erstellung von Knowledge Graphen aus unstrukturierten Daten wie (Enterprise) Wikis

Kooperationspartner: Universität Regensburg, xapio GmbH

Fördergeber: FuE-Programm "Informations- und Kommunikationstechnik" des Freistaates Bayern

Projektzeitraum: läuft bis 2023