Information Extraction

Extraktion von Informationen aus Technical-Due-Diligence-Abschlussberichten zum Aufbau einer strukturierten Wissensbasis

Bei immer mehr Unternehmen ist die digitale Transformation ein fester Bestandteil der Unternehmensstrategie, da diese für viele als ein Schlüssel zu künftigem Erfolg gesehen wird. Und das zurecht: Die Praxis zeigt, dass der Fokus auf die Digitalisierung sich positiv auf die Entwicklung der Unternehmen auswirkt. Auch die Immobilienbranche möchte den digitalen Wandel nutzen, um ihre Marktposition in der deutschen Wirtschaft zu festigen und sich gegenüber disruptiven Wettbewerbern zu behaupten. Tiefgreifende Veränderungen wie Online-Suchportale und virtuelle Besichtigungen spielen bereits eine entscheidende Rolle im Arbeitsalltag der Unternehmen. Außerdem werden E-Archive, Cloud Computing oder das Internet-of-Things (IoT) immer wichtiger. 

Durch diese Herausforderungen wird der Arbeitsalltag erschwert und Mitarbeitern können sich immer weniger auf ihre Regeltätigkeiten konzentrieren. Aus diesem Grund hat sich ein internationales Beratungsunternehmen für den Bau- und Immobiliensektor mit Hauptsitz in Deutschland das Ziel gesetzt, zu erproben, inwiefern bestehende digitale Technical-Due-Diligence-Abschlussberichte (TDD-Abschlussberichte) mittels eines neuen, intelligenten Systems analysiert werden können, um auf Basis des textuellen Inhalts ausgewählte fachlich relevante Informationen (z. B. den Stichtag der Gebäudebegehung) automatisiert zu extrahieren. Die Herausforderung liegt dabei insbesondere in der unterschiedlichen Strukturierung der TDD-Abschlussberichte, die sich sogar innerhalb eines Standortes des Beratungsunternehmens in Aufbau, Struktur und Inhalt unterscheiden können. Momentan müssen diese Informationen MitarbeiterInnen auf Basis der textuellen Inhalte der TDD-Abschlussberichte in einem aufwändigen und zeitintensiven Prozessschritt manuell erfassen. Vor dem Hintergrund der großen und immer weiter steigenden Anzahl TDD-Abschlussberichte, wird es für das Beratungsunternehmen zunehmend schwieriger, alle ausgewählten Informationen in angemessener Zeit konsistent und mit der gebotenen Sorgfalt zu extrahieren. Dies ist allerdings gerade für den zeitnahen Aufbau einer strukturierten Wissensbasis, welche die Informationen aus den TDD-Abschlussberichten für weitergehende Analysen maschinenauswertbar verfügbar macht, unabdingbar.

Zur Umsetzung dieses disruptiven Vorhabens wurde in Kooperation mit dem Institut für Business Analytics ein System entwickelt, welches automatisiert die digitalen TDD-Abschlussberichte analysiert und die gewünschten fachlichen Informationen auf Basis des textuellen Inhalts extrahiert. Dazu wurde Verfahren der künstlichen Intelligenz für die Information Extraktion konzipiert und implementiert. Nachdem die technische Konzeption und Umsetzung erfolgt ist, wurde abschließend die Güte des Systems ermittelt, um die Funktionsweise der Implementierung zu bestätigen. Dabei konnten über 93% der gesuchten Informationen extrahiert werden (Recall) bei einem sehr hohen Anteil von 98% korrekt extrahierten Informationen (Precision).

Kooperationspartner: Beratungsunternehmen für den Bau- und Immobiliensektor

Projektzeitraum: Juni 2018 – August 2018