Texterkennung von historischen Dokumenten mit Transkribus
Was ist Transkribus?
Transkribus ermöglicht es Textmaterial automatisch transkribieren zu lassen. Für das Programm ist es unerheblich, ob es sich dabei z.B. um einen handschriftlich in Kurrent geschriebenen oder in Fraktur gedruckten Text handelt. Die Transkriptionen werden von Transkribus mithilfe von KI-Modellen erstellt, die darauf trainiert worden sind, bestimmte Schrifttypen in bestimmten Sprachen zu erkennen. Je besser der Datenstamm ist, mit dem das Modell trainiert wurde, desto zuverlässiger sind auch die Transkriptionen. Die Anzahl an verfügbaren Modellen wächst stetig und da Transkribus im Kern ein kooperatives Projekt ist, werden neue von WissenschaftlerInnen trainierte Modelle in der Regel allen weiteren NutzerInnen zur Verfügung gestellt. Gleichzeitig bietet Transkribus die Möglichkeit, die eigenen transkribierten Texte mit Hilfe der Software zu analysieren und eigene KI-Modelle zu erstellen.
Ziel dieser Übung
Diese Übung möchte Ihnen die Funktionen von Transkribus näherbringen, die Sie benötigen, um mit dem Programm automatische Transkriptionen erstellen zu können. Transkribus kann hier ein Werkzeug sein, das Ihnen den Einstieg in die Transkription von Handschriften erleichtert. Sie müssen auch kein umfassendes Vorwissen im Umgang mit alten Schrifttypen mitbringen, um einen Mehrwert aus den automatisch erstellten Transkriptionen ziehen zu können. Eine Handvoll richtig transkribierter Worte sind manchmal schon ausreichend, um den Inhalt eines Text zu erahnen. So kann Ihnen Transkribus viel Zeit ersparen, wenn Sie eine größere Menge Dokumente unter einer bestimmten Frage bearbeiten. Die automatische Transkription ist zwar nie komplett richtig, aber die Worte, die das Programm erkannt hat, reichen in der Regel aus, um einschätzen zu können, ob ein Dokument für Ihre Fragestellung relevant ist und ob es sich lohnt, es vollständig zu transkribieren. Im Mittelpunkt dieser Übung stehen also nur die Prozesse, die es Ihnen ermöglichen, einen ersten Zugang zu Ihrem Textmaterial zu finden und nicht etwa das Erstellen von Transkriptionen, die z.B. im Rahmen einer Edition verwendet werden könnten. Die weiteren Funktionen von Transkribus werden hierbei weitgehend unbeachtet bleiben.
Am Ende dieser Übung werden Sie mit Hilfe von Transkribus eine vollständig transkribierte Handschrift erarbeitet haben. Lesen Sie sich dafür die Schritte nacheinander durch und folgen Sie den dort beschriebenen Arbeitsschritten bevor Sie zum nächsten Schritt übergehen. Das Dokument, welches Sie bearbeiten werden, werden Sie im Schritt 'Dokumente importieren' herunterladen können. Im ersten Schritt werden Sie jedoch zunächst das Programm installieren.
Empfohlene Zitierweise
Alexander Goebbels, Texterkennung mit Transkribus, in: historicum-estudies, 2020 (Datum des letzten Besuchs).