Fraunhofer IPK

Institut für Produktionsanlagen und Konstruktionstechnik

Automatisierte virtuelle Rekonstruktion der zerrissenen Stasi-Akten

Das Fraunhofer IPK beschäftigt sich im Rahmen von Forschung und Entwicklung seit Mitte der 1990er Jahre mit der Digitalisierung und Rekonstruktion beschädigter und zerstörter Dokumente. Im April 2007 erhielt das Institut vom Beschaffungsamt des Bundesministeriums des Innern (BMI) den Forschungsauftrag, ein Verfahren und ein Pilotprojekt zu entwickeln, mit dem zerrissene Unterlagen des Ministeriums für Staatssicherheit (MfS) der ehemaligen DDR virtuell rekonstruiert werden können. In der auf vier Jahre angesetzten Pilotphase sollen 400 von mehr als 15.000 Säcken mit zerrissenen Dokumenten verarbeitet werden.

Im Rahmen der bisher erfolgten Arbeiten wurden zunächst alle Grundlagen zur schrittweisen Inbetriebnahme eines Systems zur virtuellen Rekonstruktion geschaffen. Das System umfasst folgende Komponenten: Digitalisierungs-Hardware und Serversystem für den Digitalisierungs-Workflow, Gridbasiertes Serversystem für den Rekonstruktions-Workflow, Rekonstruktionsmodule (ePuzzler), und Softwareframework zur kontextabhängigen Ansteuerung der Rekonstruktionsmodule.

Der Gesamtprozess

Der ePuzzler ist eine vom Fraunhofer IPK entwickelte Rekonstruktionssoftware, die mithilfe komplexer Algorithmen der Bildverarbeitung und Mustererkennung gescannte Papierfragmente automatisiert zu vollständigen Seiten zusammensetzt. Außerdem stellt sie Werkzeuge zur Verfügung, um fragwürdige oder doppeldeuti­ge Puzzleergebnisse manuell zu prüfen und zu korrigieren. Der ePuzzler gliedert sich in die drei Hauptkomponenten Merkmalsextraktion, Suchraumreduktion und Matcher. Da sich bei zerrissenem Papier keine zwei Schnipsel exakt gleichen, lässt sich vorab nicht bestimmen, wie oft und in welcher Abfolge die verschiedenen Module während eines Rekonstruktionsvorgangs ineinander greifen müssen. Daher sind sie durch ein komplexes Softwareframework in einen nicht deterministischen, adaptiven Workflow eingebettet. Die Methodik der virtuellen Rekonstruktion gleicht der eines Men­schen beim Puzzeln. Er entscheidet anhand einer Vielzahl von Merkmalen, ob zwei Teile zusammen passen oder nicht. Ana­log zur menschlichen Vorgehensweise berechnet der ePuzzler zunächst verschiedene Merkmale der Schnipsel – wie Kontur, Papierfarbe, Schrift oder Linierung. Sie werden genutzt, um den kombinatorischen Aufwand beim Puzzeln zu reduzieren – das ist speziell bei großen Datenmengen wichtig. Ähnliche Schnipsel werden daher mittels intelligenter Suchraumreduk­tion in Untermengen zusammengefasst. Innerhalb der redu­zierten Mengen findet dann die eigentliche Rekonstruktion, das Matchen, statt. Dabei werden Schnipsel entlang ihrer Kon­turen auf Merkmalsübereinstimmung verglichen. Passen zwei Schnipsel zusammen, werden diese digital verklebt und bei der weiteren Rekonstruktion als größeres Fragment berücksichtigt.

Abb._01_deutsch Abb._03_deutsch
Gesamtprozess des »Stasi-Puzzles«
©Fraunhofer IPK

ePuzzler: Technologie der virtuellen Rekonstruktion
©Fraunhofer IPK