Fraunhofer IPK

Institut für Produktionsanlagen und Konstruktionstechnik

Automatisierungstechnik | ST

Automatisierte virtuelle Rekonstruktion der zerrissenen Stasi-Akten


Die von dem Ministerium für Staatssicherheit (MfS) der DDR 1989 vorvernichteten, d.h. per Hand zerrissenen, Unterlagen der Stasi wurden nach dem Fall der Mauer in ca. 15 500 Säcken gesichert. Diese etwa 600 Mio. Schnipsel versuchte der BStU im Sinne historisch-gesellschaftlicher Aufarbeitung manuell wiederherzustellen. Das Fraunhofer IPK hatte die Idee, ein System zu entwickeln, das zerrissene Stasi-Akten automatisiert virtuell rekonstruiert. Diese Initiative führte zum sog. „Stasi-Schnipsel-Projekt“, bei dem die zeitaufwändige und teils unmögliche manuelle Zusammensetzung durch das automatisierte System des Fraunhofer IPK ersetzt wurde.

 

Der ePuzzler ist eine vom Fraunhofer IPK entwickelte Rekonstruktionssoftware, die mithilfe komplexer Algorithmen der Bildverarbeitung und Mustererkennung gescannte Papierfragmente automatisiert zu vollständigen Seiten zusammensetzt. Außerdem stellt sie Werkzeuge zur Verfügung, um fragwürdige oder doppeldeutige Puzzleergebnisse manuell zu prüfen und zu korrigieren. Der ePuzzler gliedert sich in die drei Hauptkomponenten Merkmalsextraktion, Suchraumreduktion und Matcher. Da sich bei zerrissenem Papier keine zwei Schnipsel exakt gleichen, lässt sich vorab nicht bestimmen, wie oft und in welcher Abfolge die verschiedenen Module während eines Rekonstruktionsvorgangs ineinander greifen müssen. Daher sind sie durch ein komplexes Softwareframework in einen nicht deterministischen, adaptiven Workflow eingebettet. Die Methodik der virtuellen Rekonstruktion gleicht der eines Menschen beim Puzzeln. Er entscheidet anhand einer Vielzahl von Merkmalen, ob zwei Teile zusammen passen oder nicht. Analog zur menschlichen Vorgehensweise berechnet der ePuzzler zunächst verschiedene Merkmale der Schnipsel – wie Kontur, Papierfarbe, Schrift oder Linierung. Sie werden genutzt, um den kombinatorischen Aufwand beim Puzzeln zu reduzieren – das ist speziell bei großen Datenmengen wichtig. Ähnliche Schnipsel werden daher mittels intelligenter Suchraumreduktion in Untermengen zusammengefasst. Innerhalb der reduzierten Mengen findet dann die eigentliche Rekonstruktion, das Matchen, statt. Dabei werden Schnipsel entlang ihrer Konturen auf Merkmalsübereinstimmung verglichen. Passen zwei Schnipsel zusammen, werden diese digital verklebt und bei der weiteren Rekonstruktion als größeres Fragment berücksichtigt.

Am Fraunhofer IPK entstand eine weltweit einzigartige Rekonstruktionstechnologie, die 2013 mit dem europäischen Innovationspreis EARTO ausgezeichnet wurde. In den letzten Jahren fand diese breite Anwendung im Bereich der Wiederherstellung von zerstörten, aber auch beschädigten, Kulturgütern. Dabei sollen gesellschaftlich wertvolle Kulturschätze, die durch Naturkatastrophen, Terror oder nicht sachgerechte Lagerung beschädigt worden sind, wieder lesbar und für ein breiteres Publikum zugänglich gemacht werden. Erste Projekte sind die Digitalisierung und Rekonstruktion der geborgenen Fragmente des eingestürzten Historischen Archivs der Stadt Köln sowie die Rekonstruktion der Textzusammenhänge in den zerschnittenen Handschriften des Universalgelehrten Gottfried Wilhelm Leibniz. Die Rekonstruktionstechnologie hat auch Eingang in den Behördenmarkt gefunden. Im Auftrag von Finanzfahndungs- und Zollbehörden wurden geschredderte Beweismittel wiederhergestellt. Derzeit entsteht ein System zur Rekonstruktion von zerstörten Banknoten für den Einsatz bei der Deutschen Bundesbank.


Gesamtprozess des »Stasi-Puzzles«
© Fraunhofer IPK



ePuzzler: Technologie der virtuellen Rekonstruktion
© Fraunhofer IPK