Domänenexperten erstellen eigenständig Machine-Learning-Lösungen

Machine Learning für alle!

Datenanreicherung mit Domänenwissen

Zunächst werden im Model Builder Datensätze angelegt, die es dann später im Rahmen eines angelegten Projekts mit Domänenwissen Grenzwerten und Regeln anzureichern gilt. Die importierten Datensätze – z.B. im CSV-Format direkt aus der SPS kommend oder aus anderen Datenbanken – werden automatisch visuell aufbereitet und als Kacheln dargestellt. Dabei werden die Daten mit Hilfe von statistischen Qualitätsindikatoren bewertet, so dass dem Anwender schon auf den ersten Blick ein Gefühl vermittelt wird, wie gut sich eine Datenspur überhaupt für Machine Learning eignet. „Der Ingenieur kann auf Anhieb nachvollziehen, wie gut die erfassten Daten sind.“ Im nächsten Schritt geht es dann um das Labeling der Daten, auch Tagging genannt. Wie gesagt wollen wir, dass Nutzer bewusst ihre Expertise einbringen“, unterstreicht Gaukstern erneut. „Und das beginnt schon an dieser Stelle.“ Dabei reichert der Nutzer ausgewählte Datenspuren mit seinem Prozess- und Maschinenwissen an. So können z.B. Zeitbereiche in den Daten markiert werden, um das Normalverhalten oder ein ungewünschtes Verhalten zu markieren. Auch spezielle Zustände im Prozess wie das Anlaufverhalten oder Störungen bzw. Fehler lassen sich entsprechend kennzeichnen. „Auf diese Weise entsteht ein mit dem Maschinen- und Prozesswissen angereicherter Datensatz.“, sagt Gaukstern. Weiter geht es mit dem Feature-Engineering: Hier kann der Nutzer auf Basis seines Domänenwissens mit wenigen Klicks eigene Features kreieren, anhand derer sich ein bestimmtes Verhalten in den Daten beschreiben lässt. Dabei bewertet der Nutzer die Relevanz der Daten und stellt sie gegebenenfalls in Relation zueinander – mit einfachen mathematischen Funktionen. „Die Mathematik findet komplett im Hintergrund statt.“

Automatisches Training der ML-Modelle

Nach diesen Schritten kann der Anwender bereits mit dem Training eines Machine-Learning-Modells starten. Dafür wird zuerst festgelegt was für ein Modell auf Basis des angereicherten Datensatzes trainiert werden soll: Ein Modell zur Anomalieerkennung, Klassifikation oder Fehlervorhersage. Anschließend kann der Nutzer die Auswahl der Variablen für das Modelltraining bei Bedarf schon einschränken, muss es aber nicht. Als letzten Schritt legt der Nutzer die Zielfunktion für das Modell fest. Dies erfolgt anhand der im Datensatz markierten Anomalien, Fehler oder anderer Zustände. Dann startet das automatische Modelltraining. Im Hintergrund werden dann für jede Datenspur im Datensatz bis zu 300 Features automatisch generiert, um den maximalen Informationsgewinn aus den Rohdaten zu erhalten. Es folgt eine Korrelationsanalyse, um die relevanten Features für das Modelltraining zu extrahieren. Dann startet das eigentliche Modelltraining, bei dem unterschiedliche ML-Verfahren mit unterschiedlichen Feature-Sets trainiert, optimiert und validiert werden. Abschließend erhält der Nutzer eine Liste alternativer ML-Modelle, die nach Performance, Zuverlässigkeit, Ausführungszeit oder Datenmenge in eine Rangfolge gebracht werden können, so dass der Nutzer das für seinen Use Case passende Modell auswählen kann. Für jedes Modell ist nachvollziehbar welche Features verwendet werden und wie wichtig das jeweilige Feature für das Modell ist. Weidmüller verspricht hier größtmögliche Transparenz.

Das Modell ist niemals fertig

„Mehr muss der Anwender nicht tun“, resümiert Gaukstern. Ist der Nutzer mit dem Ergebnis nicht zufrieden, kann der Prozess iterativ durchlaufen werden und auch eine Weiterentwicklung der Modelle im Betrieb ist möglich. Im Prinzip sei ein Machine-Learning-Modell niemals wirklich fertig, so Gaukstern. „Einmal erstellt, lässt es sich stetig weiterentwickeln und verbessern.“ Natürlich hat Weidmüller die verwendeten ML-Verfahren nicht neu erfunden, sondern greift auf bewährte Bibliotheken zurück. „Bei unserem Industrial AutoML Tool nutzen wir Open-Source-Modelle für das maschinelle Lernen. Damit ist Weidmüller nicht alleine“, sagt Gaukstern abschließend. „Allerdings ist es uns gelungen, Machine Learning auf diese einfache Art und Weise den Ingenieuren bei Maschinenbauern und -betreiber zugänglich machen..“ (mby)

Seiten: 1 2


  • VDMA startet Nachwuchskampagne

    Der VDMA startet die Nachwuchskampagne ‚Talentmaschine‘, die darauf abzielt, junge Menschen für Technologien und technische Berufe zu begeistern. Sie richtet sich vor…


  • NEONEX, Fabasoft Approve & KSB: „Win-win-win-Situation“ durch starke Partnerschaft

    Im Zuge einer Smart-Factory-Potenzialanalyse für ihren Kunden KSB identifizierte die Managementberatung NEONEX Opti mierungschancen bei der Beschaffung der Lieferantendokumentation sowie der Erstellung…