Fraunhofer IPK

Institut für Produktionsanlagen und Konstruktionstechnik

Maschinelles Sehen

Die Fähigkeit zur Verarbeitung visueller Information ist eine Grundbedingung für viele automatisierte Prozesse. Die Abteilung Maschinelles Sehen bringt seit Anfang der 1980er Jahre mit innovativen Methoden der digitalen Bildverarbeitung und Mustererkennung Maschinen das »Sehen« bei. Internationales Renommee erlangte sie vor allem mit einer Software, die zerrissene Dokumente virtuell rekonstruiert.

Die Automatisierung industrieller Prozesse brachte die Notwendigkeit mit sich, technische Systeme mit visuellen ­Fähigkeiten auszustatten. Nur wenn eine Maschine ein Bauteil »erkennen« sowie seine Lage oder Beschaffenheit beurteilen kann, kann sie autonom damit arbeiten. Außerdem ermöglicht maschinelles Sehen Anwendungen, die anders nicht denkbar wären. Optische Prüfsysteme etwa begutachten ­Strukturen, die das menschliche Auge kaum oder nicht erkennen kann. Zudem operieren sie in Umgebungen, wo der Einsatz menschlicher Arbeiter aus Sicherheitsgründen nicht zu verantworten ist. Ähnliches gilt für messtechnische und prozessregelnde Systeme.

In der Abteilung Maschinelles Sehen treiben wir die Entwicklung bildauswertender Systeme voran. Hier entstanden zunächst lernende Methoden zur Inspek­tion von Materialoberflächen im Rahmen der Qualitätssicherung und zur Steuerung von Handhabungs- und Montageprozessen sowie – daher der Name – Überwachungssysteme, die die Sicherheit von Arbeitern in Gefahrräumen gewährleisten. Neue Handlungsfelder ergaben sich seit den 1990er Jahren durch die Übertragung der produktionstechnischen Lösungen auf nicht industrielle Anwendungsfelder. Seither ist die Abteilung eine international anerkannte Größe auf den Gebieten Bildsegmentierung, Zeichen- und Dokumenteninterpretation, Bewegungsanalyse, Objektklassifikation sowie biometrische Erkennungssysteme. So wurden Systeme zur Fahrzeugerkennung und zur Identifika­tion von Personen mittels biometrischer Merkmale realisiert.

Automatisierte virtuelle Rekonstruktion

Die prominenteste IPK-Anwendung auf dem Gebiet der Bildverarbeitung ist eine Technologie, die zerrissene oder geschredderte Dokumente virtuell rekonstruiert. Damit wird beschädigtes Archivgut oder Beweismaterial wieder auswertbar. Das System wird entwickelt, um zerrissene Akten des DDR-Staatssicherheitsdienstes wieder lesbar zu machen. Doch das Verfahren ist auch für viele andere Anwendungsbereiche von Interesse. Das Herz der virtuellen Rekonstruktion ist der ePuzzler: eine am IPK entwickelte Software, die mit neuartigen Bildverarbeitungs- und Mustererkennungsalgorithmen gescannte Papierfragmente zu vollständigen Seiten zusammensetzt. Dabei werden in einem adaptiven, nicht-deterministischen Workflow eine Vielzahl von Merkmalen verarbeitet, etwa die Kontur, Farbe, Beschriftung und Linierung der Schnipsel.

Von der Rekonstruktion zur »Reparatur«

Denkt man die virtuelle Rekonstruktion weiter, besteht der logische nächste Schritt darin, sie auf dreidimensionale Gegenstände anzuwenden. Dabei besteht das Ziel – gerade im Anwendungsfeld Archäologie – in der Regel nicht darin, Objekte nur virtuell zusammenzusetzen. Vielmehr kann das Ergebnis einer virtuellen 3D-Rekonstruktion als Vorlage für eine tatsächliche Wiederherstellung dienen. Für die Zukunft planen wir zudem die Entwicklung von Werkzeugen zur Unterstützung von physischer Rekonstruktion. Dazu gehört etwa ein »Rekonstruktionsroboter«, der bei der Rekonstruktion zerstörter Fassaden oder Wandmosaike zum Einsatz kommen könnte. Kompetenzen beider Abteilungen des Geschäftsfeldes Automatisierungstechnik greifen dabei ineinander.

Mustererkennung in digitalen Welten

Aktivitäten zur Mustererkennung in digitalen Medien ­führen uns aktuell zu unseren ­sicherheitstechnischen Wurzeln ­zurück. Tools zur inhaltlichen Analyse von Fotos und Filmen sollen Fahndern helfen, illegale Inhalte auf Datenträgern und im Web ausfindig zu machen. Die Auswertung von Überwachungskamera-Bildern im Hinblick auf Aggressivität oder Angst suggerierende Bewegungsmuster kann genutzt werden, um die Sicherheit in öffentlichen Räumen zu gewährleisten. Die dafür entwickelten Algorithmen stoßen auch bei der Medienindustrie auf breites Interesse, etwa zur Automatisierung von aufwendigen Medienanalysen oder zum Auffinden von Plagiaten.