Predictive Maintenance – eine Anwendung von „Big Data Analytics“

Predictive Maintenance – eine Anwendung von „Big Data Analytics“

Unter „Predictive Maintenance“ versteht man eine Verbindung von Wartungsintervallen mit Daten-getriebenen Vorhersagen über die Notwendigkeit einer Wartung.1

Dieser Artikel soll neben einem technischen Einblick, allgegenwärtige Probleme aufzeigen, die ein Verständnis zu schaffen, warum Predictive Maintenance noch nicht flächendeckend eingesetzt wird. Diese Annahme lässt sich zumindest treffen, nachdem der Suchbegriff „Predictive Maintenance“ von Suchmaschinen eher mit “Whitepapern” beantwortet wird als mit Statistiken über die unaufhaltsame Verbreitung…

Was heißt Predictive Maintenance eigentlich, konkret im Falle von Fahrzeugflotten?

Ein IT-System wertet Fahrzeugdaten aus und empfiehlt basierend auf Vergangenheitswerten bedarfsgerecht, wann eine Wartung im Idealfall durchgeführt werden soll. Dadurch können akute Fahrzeugausfälle und Folgekosten reduziert werden, indem Ausfall-gefährdete Komponenten rechtzeitig vor dem Ausfall getauscht werden.

Obwohl Predictive Maintenance gerade einen starken Hype erfährt2, gibt es zahlreiche Gründe, die eine Einführung bremsen:

  • Erfordernis einer hochperformanten IT Infrastruktur – bestehende Modelle prüfen kontinuierlich Daten (z.B. der Fahrzeugsysteme) gegen trainierte Modelle und überführen die neuen Daten später in den Datenpool um das Modell upzudaten, auf Grund massiver Daten Mengen (“Big Data”) und häufiger Update-Zyklen wird hier tatsächlich starke Rechenpower erfordert.
  • Keine Kostenvorteile alleine durch Predictive Maintenance, sondern durch abgeleitete Maßnahmen – Informationen durch Predictive Maintenance Anwendungen können Daten-getriebene Entscheidungen ermöglichen um kosteneffizient(er) zu handeln. Die Entscheidungen zur Durchführung von z.B. Wartungen müssen immer noch vom Menschen getroffen werden.
  • Wenige, vorliegende Industrie-Beispiele – trotz vermutlich starkem Hebel zur Kosteneinsparung konnte noch kein Vorreiter-Unternehmen besonders durch den operativen Betrieb einer Predictive Maintenance Lösung herausragen. Das lässt ebenso die breite Masse zögern.

Ein Einblick in das Vorgehen von Predictive Maintenance macht diese Erfordernisse deutlich.

Wie funktioniert Predictive Maintenance?

Predictive Maintenance ist eine Anwendung von „Data Mining“, wobei bestehende Datengrundlagen nach Erkenntnissen für Vorhersagen durchsucht werden. In Fachkreisen nutzt man den sogenannten Cross Industry Standard for Data Mining (CRISP-DM) um strukturiert vorzugehen3:

CRISP-DM Process Diagram (C) CC BY-SA 3.0

CRISP-DM Process Diagram (C) CC BY-SA 3.0

Nach dem Verständnis der Umgebung („Business Understanding“) erfolgt das „Data Understanding“, bei dem es um das Nachvollziehen der Struktur der Daten und ihrer grundsätzlichen Probleme geht (z.B. viele „n.a.“-Werte, Formatierungsprobleme,…).

Durch das „Data Processing“/ “Data Preparation” wird der Datensatz aufbereitet, um ihn weiter zu verarbeiten. Neben der Selektion von Attributen, werden hier oftmals auch neue Attribute gebildet (sog. „Feature Engineering“: z.B. Transportierte Last * Zurückgelegte Stecke = „Transportleistung in Tonnenkilometer“).

Beim „Modelling“ werden Modelle (z.B. Entscheidungsbäume) angewandt, um aus dem aufbereiteten Datensatz Muster zu extrahieren. Diese Muster können genutzt werden um entscheidende Charakteristika neuer Instanzen vorherzusagen.

Im Anschluss werden diese Modelle evaluiert: dafür teilt man den anfänglichen Datensatz oftmals auf in ein „Training Set“ und ein „Test Set“. Mit dem Training Set (z.B: 75% der Daten) wird mit dem zuvor gewählten Modell „analysiert“ um Muster zu erkennen. Die detektierten Muster und deren Vorhersagekraft werden am „Test Set“ ( z.B. verbleibende 25% der Daten) probiert (sog. Cross-Validation).

Der Grund, warum nicht das gesamte Dataset zur Modellierung genutzt wird, liegt darin, dass das Modell im Rahmen einer Training/Test-Phase nicht mehr sinnvoll getestet werden könnte: Werden 100% der Daten zum Training genutzt, kann durch Nutzung eines großen Modell-Polynoms jedes beliebige Rauschen der Daten durch die Modell-Funktion abgebildet werden. Das Modell ist damit nicht mehr so „robust“, wie eines, das mit Hilfe von 75% der Daten gebildet, wurde um 25% der Daten vorherzusagen: über die Evaluierung eines solchen Modells wird deutlich, welche Daten noch nicht ideal vorhersagt werden. Ziel ist es die Vorhersagekraft zu optimieren, jedoch ein robustes Modell zu behalten (Stichwort in der Fachsprache: „Bias-Variance Tradeoff“).

Wenn die Evaluierung abgeschlossen ist, kann das Modell genutzt werden, um neue Instanzen/Daten zu klassifizieren bzw. vorzusagen.

Welche Probleme birgt die Praxis für Predictive Maintenance?

Analysiert man den CRISP-Cycle hinsichtlich Barrieren für Predictive Maintenance, birgt die Datenqualität ein großes Problem. Derartige Systeme bergen aber auch finanzielle und kulturelle Veränderungen, die einen flächendeckenden Wechsel auf Predictive Maintenance verhindern.

Die meisten Daten-Einträge (mit Abstand) z.B. über den Fahrzeugzustand einer Flotte enthalten keine Klassifizierung eines Fahrzeugs/Bauteils als fehlerhaft, sondern meist als einwandfrei. Dadurch ist das Dataset grundsätzlich verzerrt (skewed). Gerade bei sehr heterogenen Daten von z.B. unterschiedlichen Zugmaschinen mit unterschiedlichen Fahrern hat sich noch keine Lösung dagegen durchgesetzt (in der Theorie sollte „stratified sampling“ helfen).4

Predictive Maintenance kann erst langfristig besser werden, indem es basierend auf dem initialen Modell zukünftige Daten vorhersagt, die Vorhersage prüft und kontinuierlich das Modell anpasst. Das heißt, ein „Break-Even“ für ein Predictive Maintenance System ist (nach heutigem Stand) schwer bis kaum vorherzusagen.

Der Erfolg eines derartigen Systems ist zusätzlich abhängig von seinen Bedienern: z.B. vorgezogene Wartungen, vorgezogener Teile-Wechsel, etc. wirken nicht nur finanziell als Herausforderungen, sondern widerstreben möglicherweise auch jeder Routine. Auch dieses Hindernis wird heute noch als eine zentrale Blockade gesehen.5

Beispiel für Predictive Analytics im Maintenance Bereich

Im Nachfolgenden zeigt ein Beispiel anhand eines realen Datensatzes, wie Data Analytics funktioniert. Zur Veranschaulichung werden neben Screenshots aus dem „data set“ auch „Code“-Ausschnitte (RStudio) gezeigt, um das Verständnis zu fördern.

Ein Telematiksystem übermittelt zahlreiche Parameter von Steuergeräten an die Zentrale, in der diese weiter genutzt werden. Predictive Maintenance Algorithmen würden jetzt die neuen Daten unter Nutzung eines trainierten Modells klassifizieren/vorherzusagen: Sollte das Steuergerät umgehend ausgetauscht werden (hier: Spalte „defect“)?

R-Script Beispiel: Dataset, (c) telematikwissen.de

R-Script Beispiel: Dataset, (c) telematikwissen.de

Um ein Modell zu trainieren, benötigt es zunächst „rohe Daten“. Im Falle von Predictive Maintenancen für Fahrzeugflotten sind das Daten aus Telematiksystemen.

R-Script Beispiel: Data Discretization, (c) telematikwissen.de

R-Script Beispiel: Data Discretization, (c) telematikwissen.de

Diese Daten werden im Zuge einer „Data Preparation“ in Form gebracht (Konvertieren von Zahlenformaten, Bilden von neuen Attributen: „Tonnenkilometer“, Umgang mit nichterfassten Werten, Diskretisierung von Werten etc.). Wichtig ist zu erwähnen, dass diese rohen „Training Data“ bereits in Bezug auf den Zielwert (hier: „defect“) klassifiziert sind: Ist das Bauteil ausgefallen oder nicht? Gerade weil das im Normalbetrieb nicht täglich auftritt, ist eine große Datenmenge gefragt („Big Data“), um aussagekräftige Modelle zu trainieren.

R-Script Beispiel: Feature Selection, (c) telematikwissen.de

R-Script Beispiel: Feature Selection, (c) telematikwissen.de

Anschließend werden oftmals die aussagekräftigsten Parameter/Attribute im Rahmen einer „Feature Selection“ ausgewählt (= Welche Attribute tragen am meisten dazu bei, einen Ausfall präzise vorherzusagen?). Das wird in der Regel dazu gemacht, um ein „Overfitting“ eines Modells zu vermeiden (Fehlende Generalisierung des Modells).

Auf Basis der aussagekräftigsten „Features“ wird unter Nutzung von z.B. Entscheidungsbäumen oder Regression ein Modell entwickelt (abhängig vom vorherzusagenden Wert). Je mehr Daten als Grundlage zur Verfügung stehen, desto präziser kann ein Modell entwickelt werden, andererseits wird es dadurch auch deutlich rechenintensiver.

Mit Hilfe dieser Algorithmen wir ein Modell gebaut, z.B. einen Entscheidungsbaum, mit dessen Hilfe neue Daten klassifiziert werden.

Bevor man ein Modell jedoch zur Vorhersage nutzt, wird es üblicherweise evaluiert (z.B. an Hand der Genauigkeit des Modells). Dabei versucht man insbesondere die Performance gegenüber anderen Modellen zu bewerten.

R-Script Beispiel: Model Training, (c) telematikwissen.de

R-Script Beispiel: Model Training, (c) telematikwissen.de

Für die Vorhersage ist im operativen Betrieb einer Data Analytics Lösung ein Service gefragt, der Daten (aus dem Telematiksystem) gegen das Modell abgleicht. Im Gegenzug ist es sinnvoll, dass das Modell dynamisch mit neuen, klassifizierten Werten „gefüttert“ wird, indem diese zu den „Training Data“ zugeführt werden, um das Modell neu zu trainieren.

R-Script Beispiel: Data Prediction, (c) telematikwissen.de

R-Script Beispiel: Data Prediction, (c) telematikwissen.de

Ergibt eine Vorhersage, dass ein Ausfall bevorsteht, sollte dieses Ergebnis in das operative Service-Management der Fahrzeuge zurückgeführt werden. Es könnten zum Beispiel auf dieser Basis gezielt Wartungen oder Untersuchungen vorgenommen werden, ohne den geplanten Wartungsintervall abzuwarten.

Im Unterschied zu vollständig statischen, regelbasierter „Predictive Maintenance“ können sehr komplexe Zusammenhänge automatisiert und „unvoreingenommen“ modelliert werden. Nichtsdestotrotz sind derartige Arbeitsweisen schon seit Jahren sehr erfolgreich in Betrieb. Es gilt also für Flottenbetreiber keine Wunder von „Predictive Maintenance“ zu erwarten. Die Integration in operative Betriebe ist eine Herausforderung, andererseits kann man Daten-getrieben Entscheidungen treffen. Das hilft nicht nur dabei die Straßen ein wenig sicherer für Fahrer und andere Verkehrsteilnehmer zu machen, sondern auch Kosten für Ausfälle zu reduzieren.

1. Mobley, R. K. (2002). An introduction to predictive maintenance. Butterworth-Heinemann.

2. Velosa, A., Schulte, W. R., & Benoit, J. L. (2016). Hype Cycle for the Internet of Things, 2016.

3. Angelehnt an: Wirth, R., & Hipp, J. (2000, April). CRISP-DM: Towards a standard process model for data mining. In Proceedings of the 4th international conference on the practical applications of knowledge discovery and data mining (pp. 29-39).

4. Maloof, M. A. (2003, August). Learning when data sets are imbalanced and when costs are unequal and unknown. In ICML-2003 workshop on learning from imbalanced data sets II (Vol. 2, pp. 2-1).

5. Berger, R. (2015). Predictive maintenance–Is the timing right for predictive maintenance in the manufacturing sector?| Alle Publikationen| Medien| Roland Berger.