Automatisierte virtuelle Rekonstruktion zerrissener Stasi-Akten

© Fraunhofer IPK / Gerold Baumhauer

Die von dem Ministerium für Staatssicherheit (MfS) der DDR 1989 vorvernichteten, d.h. per Hand zerrissenen, Unterlagen der Stasi wurden nach dem Fall der Mauer in ca. 15 500 Säcken gesichert. Diese etwa 600 Mio. Schnipsel versuchte der BStU im Sinne historisch-gesellschaftlicher Aufarbeitung manuell wiederherzustellen. Das Fraunhofer IPK hatte die Idee, ein System zu entwickeln, das zerrissene Stasi-Akten automatisiert virtuell rekonstruiert. Diese Initiative führte zum sog. »Stasi-Schnipsel-Projekt«, bei dem die zeitaufwändige und teils unmögliche manuelle Zusammensetzung durch das automatisierte System des Fraunhofer IPK ergänzt wurde.

Der ePuzzler ist eine vom Fraunhofer IPK entwickelte Rekonstruktionssoftware, die mithilfe komplexer Algorithmen der Bildverarbeitung und Mustererkennung gescannte Papierfragmente automatisiert zu vollständigen Seiten zusammensetzt. Außerdem stellt sie Werkzeuge zur Verfügung, um fragwürdige oder doppeldeutige Puzzleergebnisse manuell zu prüfen und zu korrigieren. Der ePuzzler gliedert sich in die drei Hauptkomponenten Merkmalsextraktion, Suchraumreduktion und Matcher. Da sich bei zerrissenem Papier keine zwei Schnipsel exakt gleichen, lässt sich vorab nicht bestimmen, wie oft und in welcher Abfolge die verschiedenen Module während eines Rekonstruktionsvorgangs ineinander greifen müssen. Daher sind sie durch ein komplexes Softwareframework in einen nicht deterministischen, adaptiven Workflow eingebettet. Die Methodik der virtuellen Rekonstruktion gleicht der eines Menschen beim Puzzeln. Er entscheidet anhand einer Vielzahl von Merkmalen, ob zwei Teile zusammen passen oder nicht. Analog zur menschlichen Vorgehensweise berechnet der ePuzzler zunächst verschiedene Merkmale der Schnipsel – wie Kontur, Papierfarbe, Schrift oder Linierung. Sie werden genutzt, um den kombinatorischen Aufwand beim Puzzeln zu reduzieren – das ist speziell bei großen Datenmengen wichtig. Ähnliche Schnipsel werden daher mittels intelligenter Suchraumreduktion in Untermengen zusammengefasst. Innerhalb der reduzierten Mengen findet dann die eigentliche Rekonstruktion, das Matchen, statt. Dabei werden Schnipsel entlang ihrer Konturen auf Merkmalsübereinstimmung verglichen. Passen zwei Schnipsel zusammen, werden diese digital verklebt und bei der weiteren Rekonstruktion als größeres Fragment berücksichtigt.

 

Europäischer Innovationspreis

Für die Entwicklung des ePuzzlers wurden Fraunhofer IPK-Forscher am 4. Dezember 2013 mit dem EARTO-Innovationspreis der European Association of Research and Technology Organisations ausgezeichnet.