Orientierung im Datendschungel
Doch was genau zeichnet hochwertige Trainingsdaten aus? Datenqualität wird von zahlreichen Faktoren beeinflusst, hängt aber entscheidend von der Erfassungsmethode ab: Für die Gewinnung hochwertiger Daten ist ein akkurater Aufnahmeprozess unerlässlich. Im nächsten Schritt muss dann in den so gewonnenen, noch unsortierten Daten die Teilmenge gefunden werden, die das Zeug zu erstklassigen Trainingsdaten hat, sprich exakt die Informationen enthält, die die KI zum Lernen braucht. Die große Kunst besteht darin, aus einer Datenmenge genau diese Informationsmerkmale und -muster im genau richtigen Mengenverhältnis herauszufiltern.
Altteil-Identifizierung per KI
Mit dieser Herausforderung haben sich Forschende des Fraunhofer IPK im Projekt »EIBA« beschäftigt. Dabei wurde gemeinsam mit Technologiepartnern ein KIbasiertes Assistenzsystem entwickelt, das alte Kfz- Bauteile identifiziert und ihren Zustand bewertet – ganz ohne QR- oder Barcodes. Der Hintergrund: Zahlreiche (Industrie-)Altteile landen jährlich zum Recycling auf dem Schrottplatz. Ökologisch und ökonomisch sinnvoller wäre das sogenannte Remanufacturing, bei dem das verschlissene Bauteil wieder an seinen Neuzustand angeglichen wird. Voraussetzung hierfür ist jedoch, dass das Produkt eindeutig identifiziert wird – und das ist mühsam, wenn es verschmutzt, verrostet oder überlackiert ist und sich viele Produkte ohnehin nur geringfügig unterscheiden. Durch das neue Assistenzsystem werden die Mitarbeitenden bei der schwierigen Altteil-Beurteilung deutlich entlastet.
Schnellstart mit wenig Daten
Aufgabe des Fraunhofer IPK-Teams war es, neuronale Netze und spezielle Algorithmen für das Maschinelle Sehen der Altteile zu trainieren. Bei der Datenerfassung wählten die Forschenden einen multimodalen Ansatz, der bewusst auf mehrere Datenquellen zugreift. Denn ein einzelnes Bild ist für die KI oft nicht ausreichend, um ein Objekt eindeutig zu identifizieren. Im menschlichen Vergleich dazu greifen wir das Objekt auf, betrachten es aus verschiedenen Blickwinkeln, suchen nach charakteristischen Merkmalen und beziehen weitere Informationen ein, die unabhängig von Farbe und Form sind. Inspiriert von dieser multisensorischen menschlichen Wahrnehmung umfasst die am Fraunhofer IPK entwickelte Lösung Stereokameras und eine Waage, um das Gewicht und optische Eigenschaften in 2D und 3D zu erfassen. Zudem werden auch bereits aus den Logistik- und Dokumentationsprozessen vorhandene Geschäfts- und Lieferdaten miteinbezogen.
Da es gerade für kleinere Firmen aufwendig und teuer ist, im Vorfeld große Datenbestände zu generieren – das heißt, sämtliche Altteile bildhaft zu erfassen – wurde die Datenerhebung durch fest installierte Kameras am Arbeitsplatz in den laufenden Betrieb des Anwendungspartners C-ECO, eines Dienstleisters für die Kreislaufwirtschaft, integriert. Auf diese Weise kamen in einem ersten Proof-of-Concept rund 200 000 Bilddaten zusammen. Trainingsdaten hatte die KI folglich mehr als genug – aber genügte das, um effektive Ergebnisse zu erzielen? Womit die Forschenden nicht gerechnet hatten, war die häufig schlechte Qualität der Bilddaten. Auf vielen Aufnahmen waren Hände, Kaffeetassen oder andere Utensilien im Bild, war das Bauteil abgeschnitten, verschattet oder nur der leere Arbeitstisch zu sehen.
Ein erheblicher Teil der Daten erwies sich nicht nur als unbrauchbar für das Training, sondern schadete ihm sogar. Denn der Algorithmus versuchte zu lernen, Objekte auf Bildern zu erkennen – obwohl diese Objekte zum Teil verdeckt waren, mit einem unordentlichen Hintergrund verschmolzen oder ganz fehlten. Dadurch wurden Korrelationen in den Daten erfasst, die keinen Sinn ergaben, zugleich konnten wichtige Klassen oder Muster nicht ausreichend gelernt werden.