Zum Hauptinhalt springen
10.08.2021 | Marcel Weissinger, Marco Schäfler, Hans Christian Jünger

Data Mining in der Baubranche

Wissensmanagement

Die Produktivität der deutschen Bauwirtschaft ist mangelhaft. Ursache sind u. a. der unzureichende Wissenstransfer und die schlechte Datenauswertung von Bauprojekten.

Einleitung

Die Produktivität in der deutschen Bauwirtschaft hat sich in den vergangenen Jahren im Vergleich zu anderen Branchen unterdurchschnittlich entwickelt. Die Ursachen hierfür sind vielfältig. Ein Grund liegt in der geringen Auseinandersetzung mit dem Produktionsfaktor Wissen. Demgegenüber verfügen die Beteiligten von Bauprojekten über eine Vielzahl an Daten.

Es stellt sich die Frage, weshalb eine detaillierte Auseinandersetzung mit diesen Daten oftmals erst nachrangig zu anderen Tätigkeiten stattfindet. In diesem Zusammenhang nennt das Weltwirtschaftsforum einen unzureichenden Wissenstransfer als einen der Gründe für die geringe Produktivität der Bauwirtschaft. (1)

Zusammenfassend werden das bestehende Wissen und Potenzial aus vorhandenen Daten und die damit verbundenen Synergieeffekte bislang nicht im erforderlichen Maße ausgeschöpft. Demnach sind die Potenziale in der Datenauswertung von Bauprojekten zu heben und anwendungsbezogene Lösungswege aufzuzeigen.

Knowledgemanagement in Bauprojekten

Die Grundproblematik in der Gewinnung neuer Erkenntnisse und neuen Wissens besteht in den fehlenden verwertbaren Informationen für den jeweiligen Prozess. Es stellt sich daher die zentrale Frage, ob das Knowledgemanagement (deutsch: Wissensmanagement) in Bauprojekten sinnvoll eingesetzt werden kann. Unter Knowledgemanagement wird die Gewinnung bzw. die Weiterentwicklung von Kenntnissen in Unternehmen verstanden. Eine konkrete Auseinandersetzung mit den vorliegenden Informationen soll Handlungsempfehlungen für die Zukunft erzeugen. (3)

Der Prozess des Planens, Bauens und Errichtens oder Erneuerns baulicher Anlagen ist zumeist von einer langfristigen und ständigen Wechselbeziehung zwischen einer Vielzahl unterschiedlicher Projektbeteiligter geprägt. Daraus entstehen zwangsläufig viele Informationsströme am Bau. (4)

Zudem verstärken der Digital Twin oder das Smart Building die Relevanz der Auswertung von vorhandenen gebäudebezogenen Informationen. Im Ergebnis besteht ein Forschungsbedarf für den Einsatz eines Knowledgemanagements in Bauprojekten.

In diesem Kontext sind häufig Informationssilos bei den Baubeteiligten zu beobachten. Die Auseinandersetzung oder Weitergabe dieser Informationssilos findet hingegen nur selten statt. (5) Eine effektive und reibungslose Aufarbeitung von Sachverhalten wird erschwert (Informationsasymmetrie). (6) Indes kann das Auswerten von Daten langfristig die Wettbewerbsfähigkeit von Unternehmen erhöhen. Mit einer fundierten Analyse der Daten werden das Potenzial ausgeschöpft und Datensilos in Unternehmen vermieden.

Schlussfolgernd entsteht das Wissen erst mit der Herstellung von Kausalzusammenhängen aus Zeichen über mehrere Verarbeitungsstufen. Die Wettbewerbsfähigkeit wird über richtiges Handeln und die Ausbildung von Kompetenzen erreicht. Zusammenfassend ermöglicht ein branchen- und unternehmensübergreifender Austausch von Daten effizientere Bauprozesse (Informationssymmetrie) und Produktivitätssteigerungen am Bau.

Bild: Institut für Baubetriebslehre, Uni Stuttgart/HUSS-MEDIEN GmbH

Damit Wissen aus Daten generiert werden kann, sind entsprechende Handlungen von Personen notwendig. Andererseits sind die Personalkapazitäten limitiert; damit verbundene Kostenaufwendungen erschweren eine detaillierte Datenauswertung. Die Übertragung und Anwendung technologischer Methoden aus anderen Branchen stellt einen möglichen Lösungsansatz dar.

Eine gängige Methode ist das Data Mining. Damit können bislang unbekannte Zusammenhänge in großen Datenbeständen untersucht werden. Auf diese Weise sollen Vorhersagen, Trends und Verhaltensmuster in Bauprozessen erarbeitet und somit nützliches Wissen erzeugt werden.

Knowledge Discovery in Database und Data Mining

Die vorgenannte Anwendung des Data Minings als potenzieller Lösungsansatz steht dabei in einem engen Kontext zur Wissensfindung in Datenbanken (englisch: Knowledge Discovery in Databases, kurz: KDD), welche oftmals synonym verwendet werden. (7) Das KDD stellt den Gesamtprozess der Wissensgenerierung aus Daten dar. Das Data Mining befasst sich wiederum ausschließlich mit der Datenanalyse und bildet einen Teilprozess im KDD. Das übergeordnete Analyseziel dieser Methoden besteht darin, gültige, nützliche und bislang unbekannte Informationen zu identifizieren (Übergang von Big Data zu Smart Data). (8)

Insgesamt erstreckt sich der KDD-Prozess neben der Analyse der Daten auch über die vor- und nachgelagerten Schritte, die notwendig sind, um verwendbare und valide Ergebnisse zu erzielen:

Bild: Institut für Baubetriebslehre, Uni Stuttgart/HUSS-MEDIEN GmbH.

  1. Datenselektion: In diesem ersten Schritt des KDD-Prozesses erfolgt zunächst die Sichtung der Daten und das Entwickeln eines Verständnisses für deren Inhalt.
  2.  Datenvorverarbeitung: Um die Qualität des Zieldatenbestandes zu erhöhen, werden in einem zweiten Schritt fehlende oder problembehaftete Daten analysiert.
  3.  Datentransformation: In der Folge werden diese Daten in eine für weitere Analysen geeignete Form transformiert. Dies ermöglicht die Anwendung von Data Mining Methoden.
  4. Data Mining: Im vierten und elementaren Schritt erfolgt das Data Mining. Das Ziel ist die Identifikation von Mustern innerhalb des vorbereiteten Datenbestands über ausgewählte Verfahren.
  5.  Evaluation und Interpretation: Im letzten Schritt werden die gewonnen Resultate geprüft. Anschließend werden die identifizierten Muster visualisiert und interpretiert, um weitere Schritte abzuleiten.

Das KDD-Stufenmodel ist eine iterative Vorgehensweise. Ein einmaliger und starrer Durchlauf erfolgt nicht. An dieser Stelle wird auf das standardisierte Prozessmodell CRoss Industry Standard Process for Data Mining (kurz: CRISP-DM) verwiesen, das im Rahmen eines EU-Förderprojekts entwickelt wurde. Knowledge Discovery in Database hat sich in vielen Branchen – beispielsweise bei Banken, Versicherungen und im Handel – etabliert. Erfolgversprechend sind die gewonnenen Erkenntnisse, um Produkte und Prozesse zu verbessern. (10)

Übertragen auf die Baubranche findet eine detaillierte Auseinandersetzung nicht oder nur in geringem Maße statt. (11) Aus diesem Grund soll das folgende anwendungsbezogene Beispiel die Potenziale von KDD in der Baubranche aufzeigen.

Anwendung von KDD bei Kostenüberschreitungen in Bauprojekten

Eine Untersuchung von 300 fertiggestellten Hochbauprojekten des Bundes aus den Jahren 2000 bis 2015 führte zu der Erkenntnis, dass der vorgegebene Kostenrahmen in 40 Prozent der Fälle deutlich überschritten wurde. (12)

Um Kostenüberschreitungen präventiv zu begegnen und die Hintergründe zu erforschen, wird der KDD-Prozess auf abgeschlossene Projekte der Stadt Bonn angewandt. Damit wird das Ziel verfolgt, prädiktive Entscheidungen durch den Einsatz von Data-Mining-Methoden treffen zu können. Anhand dessen werden Randbedingungen und Notwendigkeiten für eine effiziente Datennutzung bei der Abwicklung von Bauprojekten erörtert.

Die Analyse der vorliegenden Daten erfolgte mit der Software RapidMiner. (13) Für die Anwendung muss der Nutzer keine spezifischen Programmierkenntnisse haben. Daher eignet sich diese Software für die kurzfristige Einführung in Baubetrieben.

In der Abbildung „Auszug aus der Software RapidMiner“ ist der Data Mining Prozess für das nachfolgende Beispiel dargestellt. Über die Eingabe von Projektdaten (z. B. Microsoft Excel) und die Auswahl von individuellen Attributen soll ein Entscheidungsbaum (ID3) generiert werden. Dieser soll zukünftig als Handlungsempfehlung für dementsprechende Bauprozesse herangezogen werden.

Bild: Institut für Baubetriebslehre, Uni Stuttgart/HUSS-MEDIEN GmbH

Verfahrensschritte nach KDD

Schritt 1: Datenselektion

Zur Analyse von Bauprojekten wurden in einem ersten Schritt die Datensätze der Stadt Bonn herangezogen. (14) Insgesamt standen die Daten aus 20 abgeschlossenen Projekten unterschiedlicher Größenordnungen zur Verfügung. Eine detailliertere Betrachtung der vorliegenden Daten zeigt, dass es bei 15 der 20 erfassten Projekte zu Kostenüberschreitungen gekommen ist. Die durchschnittliche Überschreitung der prognostizierten Baukosten betrug 14 Prozent. Die höchste erfasste Überschreitung lag bei 34 Prozent. Die eher geringe Projektanzahl soll außerdem die Skalierbarkeit dieser Methode veranschaulichen.

Datenselektion – Auszug der Projektdaten, Bild: Institut für Baubetriebslehre, Uni Stuttgart

Schritt 2: Datenvorverarbeitung

Die in den vorliegenden Controllingberichten verfügbaren Rohdaten (Budget, Termine, Projektart usw.) werden in einem nächsten Schritt extrahiert, da die Ursprungsform der Daten noch nicht für das Data Mining geeignet war. Der analyserelevante Zieldatenbestand wurde infolgedessen in eine übersichtliche Struktur übertragen, um von RapidMiner verarbeitet werden zu können. In einem weiteren Zwischenschritt wurde die Datenbasis auf potenzielle Schwächen überprüft und gegebenenfalls bereinigt. Dies können z. B. fehlende Werte oder Ausreißer sein. Die Kenntnisse über Schwächen der Analysedaten sind für die Qualität der Untersuchungsergebnisse von Bedeutung, da Ergebnisse hierdurch verzerrt werden können. (17)

Bild: Institut für Baubetriebslehre, Uni Stuttgart/HUSS-MEDIEN GmbH

Schritt 3: Datentransformation

Damit die Höhe der möglichen Kostenüberschreitung vorhergesagt werden kann, sollen die Datenobjekte mit Hilfe eines Entscheidungsbaums klassifiziert werden. Dieser ist besonders für einen offenen und transparenten glass-box-Ansatz geeignet. In der Folge können Wirkungsmechanismen objektiv und nachvollziehbar aufgezeigt werden. (18)

Den Input für das Prognosemodell liefern die folgenden vier Attribute:

  • Projektdauer
  • geplantes Budget
  • prozentuale Kostenüberschreitung
  • Projektart

Damit ein effizienter Entscheidungsbaum ermittelt werden kann, wird in einem Zwischenschritt der Datentyp von metrischen Variablen in ordinale Variablen transformiert. Intervallskalierte numerische Werte (z. B. Dauer oder Kosten) werden in eine qualitative Merkmalsausprägung (z. B. niedrig oder hoch) übertragen. Zunächst sind daher ähnliche Datenobjekte zu bündeln.

Bild: Institut für Baubetriebslehre, Uni Stuttgart/HUSS-MEDIEN GmbH

Schritt 4: Data Mining

Im vierten Schritt wird über die Software RapidMiner der Entscheidungsbaum zur Identifikation von Mustern innerhalb des vorbereiteten Datenbestands erzeugt. Hierzu ist die Zuweisung eines Zielattributs notwendig, um den Algorithmus des Entscheidungsbaums ausführen zu können. Im vorliegenden Beispiel definiert das Attribut Kostenüberschreitung das Zielattribut. Darauf aufbauend wendete die Software den ID3-Algorithmus an. Im Ergebnis wurde ein visueller Entscheidungsbaum generiert, der auch die Kombinationsmöglichkeiten aufzeigt, die zur Ausprägung des Zielattributs führen (vgl. nachfolgende Abbildung).


Bild: Institut für Baubetriebslehre, Uni Stuttgart/HUSS-MEDIEN GmbH

Schritt 5: Evaluation und Interpretation

Mit Hilfe des generierten Entscheidungsbaums können in einem letzten Schritt zukünftige Projekte in Referenzklassen eingeteilt werden. Auf Basis historischer Daten für die jeweilige Referenzklasse wird eine Aussage über die wahrscheinliche Kostensteigerung getroffen. In diesem Schritt ist demnach die visuelle Wahrnehmungsfähigkeit in den Analyse- bzw. KDD-Prozess zu integrieren.

Um die Qualität des Entscheidungsbaums besser einschätzen zu können, ist eine Vergleichbarkeit notwendig. Hierzu wurde zu Beginn der Zieldatensatz in einen Trainings- und einen Testdatensatz unterteilt. Die Klasse der Kostenüberschreitung bei den Projekten der Testmenge ist bekannt. Der Entscheidungsbaum wurde nun bezüglich seiner Trefferrate bei der Klassifikation geprüft. Die grundlegende Annahme dabei ist, dass sich neue Datensätze genauso wie die vorliegenden Trainingsdaten verhalten.

Der erzeugte Entscheidungsbaum wurde im Anschluss auf die Testmenge angewandt, wodurch eine qualitative Beurteilung der vorgenommenen Klassifikation ermöglicht wurde.

Evaluation – Ergebnis des Test-Trainingslaufs. Die Tabelle zeigt die für die Testdaten tatsächlich aufgetretene sowie die vom Modell prognostizierte Kostenüberschreitung, Bild: Institut für Baubetriebslehre, Uni Stuttgart

Aus den vorgestellten Ergebnissen ist erkennbar, dass für eine präzisere Prognose der Kostenüberschreitung infolge der vielfältigen möglichen Ursachen weitere Attribute notwendig sind, um die Genauigkeit des Modells zu steigern und potenzielle Kostenüberschreitungen zukünftiger Projekte präziser zu prognostizieren. Insgesamt konnte nachgewiesen werden, dass sich die Methoden des Data Minings, die sich in anderen Branchen bereits etabliert haben, auch in der Baubranche erfolgreich implementieren lassen.

Es war bereits mit einem kleinen Datensatz möglich, die Daten zu analysieren und Wirkungsmechanismen zur Entscheidungsfindung transparent und objektiv aufzuzeigen. Hierzu wurde ein Entscheidungsbaum generiert, der trotz der geringen Anzahl an Trainingsdaten die Testdaten mit akzeptabler Genauigkeit klassifizierte. Mit dem generierten Baum besteht das Potenzial, zukünftige Projekte zu klassifizieren und die wahrscheinliche Kategorie der Kostenüberschreitung anhand der verfügbaren Attribute vorherzusagen.

Aufgrund der geringen Anzahl der untersuchten Projekte stellt dies lediglich eine Vermutung dar. Die Ergebnisse des Entscheidungsbaums können unter Hinzunahme weiterer Attribute und einer größeren Projektdatenbank fortlaufend verbessert bzw. trainiert werden. In der Folge sind schrittweise genauere Prognosen erreichbar (Skalierungseffekte).

Erfolgsfaktoren für den Einsatz von Data Mining in der Baubranche

Damit ein nachhaltiger und zielführender Einsatz von KDD- bzw. Data Mining-Methoden in der Baubranche erreicht wird, werden im Folgenden Mindestanforderungen dargelegt. Dazu zählen:

- Expertise für

  • das jeweilige Anwendungsgebiet
  • die vorliegenden Daten
  • die angewendeten Data-Mining-Methoden
  • Interdisziplinäre Zusammenarbeit zwischen Spezialisten der Datenanalyse und Baufachexperten
  • Verständliche Visualisierung der Ergebnisse
  • Qualität der Daten und deren Erfassung
  • Vorhandensein von repräsentativen Daten für die untersuchte Problemstellung

Fazit

Der Trend der Digitalisierung der Baubranche erfordert zukunftsfähige Lösungen für die effiziente Ausgestaltung von Bauprozessen. Hierdurch wird der langfristige Lösungsansatz verfolgt, Bauwerke effizient zu gestalten. Die vorgestellten Methoden des Data Minings und KDD versprechen dabei, frühzeitig und fundiert auf etwaige Unwägbarkeiten bei der Abwicklung von Bauprojekten reagieren zu können. Dies ist insbesondere vor dem Hintergrund der aktuellen Kosten- und Terminüberschreitungen bei Bauprojekten im Zusammenhang mit der öffentlichen Wahrnehmung von Bedeutung.

Anhand des vorgestellten Beispiels konnte veranschaulicht werden, dass bereits eine kleine Menge an Trainingsdaten zu einem erfolgversprechenden Prognosemodell führen kann. Durch die Hinzunahme größerer Mengen an verwertbaren Daten sind aussagekräftigere Prognosemodelle zu erwarten. Im Ergebnis kann die Anwendung des KDD-Stufenmodells langfristig den Weg für bessere und individuell basierte Prognosen in Bauprozessen ebnen. Durch die bestehenden Softwareanbieter sind vielversprechende und benutzerfreundliche Anwendungen verfügbar.

Um die Wettbewerbsfähigkeit in bauwirtschaftlichen Unternehmen langfristig zu stärken, kann der Aufbau von entsprechenden Kompetenzfeldern im Bereich des Knowledgemanagements respektive Data Minings eine entscheidende Rolle einnehmen. Derartige digitale Konzepte von optimierten Bauprozessen werden in Anbetracht der bestehenden Herausforderungen in Zukunft an Relevanz gewinnen.

______________________________

(1) Vgl. o. V. (2016), World Economic Forum, S. 3
(2) Vgl. Schäfler/Jünger (2021), S. 17 in Anlehnung an North (2016), S. 40
(3) Vgl. Hermanni (2016), S. 299
(4) Vgl. Weissinger u. a. (2019), S. 208
(5) Vgl. o. V. (2021), Deutsche Telekom AG, S. 10
(6) Vgl. Knight (2021), Haufe-Lexware GmbH, Heft 03/2021, S. 71
(7) Vgl. Beierle/Kern-Isberner (2014), S. 143
(8) Vgl. Sharafi (2013), S. 51
(9) Vgl. Schäfler/Jünger (2021), S. 41 in Anlehnung an Fayyad (1996), S. 41
(10) Vgl. Weskamp u. a. (2014), S. 1
(11) Vgl. o. V. (2021), Deutsche Telekom AG, S. 10
(12) Vgl. Vgl. o. V. (2016), Bundesministerium für Umwelt, Naturschutz, Bau und Reaktorsicherheit, S. 4
(13) Hinweis: Entwickelt am Lehrstuhl für künstliche Intelligenz der Technischen Universität Dortmund
(14) opendata.bonn.de, Abrufdatum: 14. 12. 2020 (URL mit Link unterlegen)
(15) Vgl. Schäfler/Jünger (2021), S. 79
(16) Eigene Darstellung
(17) Vgl. Cleve/Lämmel (2016), S. 10
(18) Vgl. Institut für Technologie und Management im Baubetrieb KIT (01. 02. 2021), Internetquelle
(19) Vgl. Schäfler/Jünger (2021), S. 85

 

Literatur

Beierle, C., Kern-Isberner, G. (2014), Methoden wissensbasierter Systeme – Grundlagen, Algorithmen, Anwendungen, 5. Auflage, Wiesbaden: Springer Vieweg, S. 143

Cleve, J., Lämmel, U. (2016), Data Mining, 2. Auflage, Berlin, Boston: Walter de Gruyter, S. 10

Fayyad, U., u. a. (1996), From Data Mining to Knowledge Discovery in Databases, in: AI Magazine Volume 17 Number 3, Ausgabe Herbst 1996, S. 41

Hermanni, A.-J. (2016), Business Guide für strategisches Management – 50 Tools zum geschäftlichen Erfolg, Wiesbaden: Springer Gabler, S. 299

Institut für Technologie und Management im Baubetrieb, KIT (2020), sdac.tech/human-machine-collaboration, Abrufdatum: 18. 11. 2020 (URL mit Link unterlegen)

Knight, A. (2021), Haufe-Lexware GmbH, Heft 03/2021, S. 71

North, K. (2016), Wissensorientierte Unternehmensführung – Wissensmanagement gestalten, 6. Auflage, Wiesbaden: Springer Gabler, S. 40

o. V. (2016), Bundesministerium für Umwelt, Naturschutz, Bau und Reaktorsicherheit, Reform Bundesbau – Bessere Kosten-, Termin- und Qualitätssicherheit bei Bundesbauten, S. 4

o. V. (2016), World Economic Forum, Shaping the Future of Construction – A Breakthrough in Mindset and Technology
o. V. (2021), Deutsche Telekom AG, Digitalisierungsindex Mittelstand 2020/2021 – Der digitale Status quo im deutschen Baugewerbe, S. 10

Schäfler, M., Jünger, H. C. (2021), Data Mining in der Baubranche, Abschlussarbeit am Institut für Baubetriebslehre der Universität Stuttgart

Stadt Bonn 2020, opendata.bonn.de/dataset/berichterstattung-städtischebauprojekte,
Abrufdatum: 14. 12. 2020 (URL mit Link unterlegen)

Sharafi, A, (2013), Knowledge Discovery in Databases – Eine Analyse des Änderungsmanagements in der Produktentwicklung, Wiesbaden: Springer Gabler, S. 51

Weissinger, M., Jünger, H. C., Bernat, G. (2019), Baubegleitendes Störungscontrolling bei Großprojekten – Bauwirtschaft Heft 4/2019 – Wolters Kluwer, S. 208

Weskamp, M., u. a. (2014), Einsatz und Nutzenpotenziale von Data Mining in Produktionsunternehmen, Studie des Fraunhofer-Instituts für Produktionstechnik und Automatisierung IPA, S. 1

© Cifotart/stock.adobe.com
Autoren

Univ.-Prof. Dr.-Ing. Hans Christian Jünger ist Leiter des Instituts für Baubetriebslehre der Universität Stuttgart. Er forscht und lehrt u. a. zum Thema Digitalisierung in der Bauwirtschaft sowie den damit einhergehenden Technologien. Zuvor war er bei diversen Großprojekten für verschiedene international tätige Unternehmen in leitenden Positionen beschäftigt und verantwortlich für die Themen Digitalisierung, Lean Construction und BIM. (Bild: Institut für Baubetriebslehre, Uni Stuttgart) uni-stuttgart.de


Marcel Weissinger, M. Sc., ist akademischer Mitarbeiter am Institut für Baubetriebslehre der Universität Stuttgart. Zu seinen Forschungsschwerpunkten zählen digitale Methoden und Technologien sowie deren Auswirkungen auf die Bauprozesse. Zuvor war er als Berater im Baubetrieb und Projektmanagement tätig. (Bild: Institut für Baubetriebslehre, Uni Stuttgart) uni-stuttgart.de


Marco Schäfler, M. Sc., studierte Bauingenieurwesen an der Universität Stuttgart. Im Rahmen seiner Abschlussarbeit am Institut für Baubetriebslehre beschäftigte er sich mit den Anwendungsmöglichkeiten und Potenzialen von Data Mining in der Baubranche. Zurzeit ist er als Projektleiter bei Seyler + Pärssinen ProjektPartner in den Bereichen Projektsteuerung, Projektcontrolling sowie BIM-Management tätig. (Bild: Seyler + Pärssinen) sp-projektpartner.de

Kommentare
  • Keine Kommentare
Diesen Artikel teilen
Anzeige
botMessage_toctoc_comments_9210
Gratis Probeheft bestellen!