skip to content

Handwritten Text Recognition

Die HTR ist das Herzstück von Transkribus und hier wird besonders deutlich welchen Mehrwert das Programm für die Bearbeitung von handschriftlichen Texten darstellt. Unter dem Reiter Tools finden Sie unter dem Abschnitt Layout Analysis den Abschnitt Text Recognition. Nachdem Sie dort auf Run geklickt haben, sehen Sie das Fenster hier links und klicken auf Select HTR model.... Ihnen wird daraufhin eine Liste mit einer Vielzahl unterschiedlicher Modelle für verschiedene Schriftarten und Sprachen angezeigt. Für das Beispiel dieser Übung können Sie das Modell German_Kurrent_XIX_M1 und als Language Model (die Schaltfläche finden Sie am rechten Rand desselben Fensters) Goethe_M1 auswählen. Hier lohnt sich auch immer ein Blick auf die Details. Dort ist für die meisten Modelle angegeben, welche Dokumente ihm zugrunde liegen. Machen Sie sich auch mit den anderen zur Verfügung stehenden Modellen vertraut. So finden Sie das Modell, welches am besten zu Ihrem Material passt.

Nachdem Sie die Einstellungen getroffen haben, klicken Sie auf OK und je nachdem wie viele Seiten transkribiert werden sollen und wie viel Text sich auf diesen Seiten befindet, kann dieser Prozess einige Zeit in Anspruch nehmen. Denken Sie daran, falls sie planen eine größere Datenmenge zu bearbeiten. Über die laufenden Prozesse können Sie sich wie gehabt über die Kaffeetasse informieren. Da im Rahmen der Übung aber nur ein einzelnes Dokument transkribiert werden soll, sollte dieser Prozess nur ungefähr zwei Minuten dauern.

Wie schon bereits angekündigt kann Transkribus Ihnen nicht sämtliche Transkriptionsarbeit abnehmen, aber es ist ein nützliches Werkzeug, um den Zugang zu handschriftlichen Quellen zu erleichtern. Auch in dem Fall, dass Sie ein Modell verwenden können, das exakt auf die Hand abgestimmt ist, die Sie transkribieren möchten, werden Sie noch nachträglich an der Transkription arbeiten müssen. Allein schon, um das Ergebnis zu kontrollieren.

Schauen Sie sich also die Transkription an und machen Sie sich mit dem Schriftbild vertraut. Jede schreibende Hand ist anders und hier kann Transkribus helfen, ein Gefühl für ihre Eigenheiten zu bekommen. Verzweifeln Sie auch nicht, wenn Sie einige Wörter nicht auf Anhieb lesen können. Hier ist es hilfreich auch mal Abstand von einer Zeile oder sogar vom Text zu nehmen und sich diesem zu einem späteren Zeitpunkt mit neuer Energie erneut zu widmen. Nehmen Sie erst die Textzeilen ins Visier, die Sie lesen können und arbeiten Sie sich zu den schwierigeren vor. Je länger Sie sich mit einer Hand beschäftigen, desto einfacher wird es Ihnen fallen, sie zu lesen.

Wenn Sie sich weiter mit der deutschen Kurrentschrift beschäftigen möchten, können Sie sich das Buch "Süß, Harald, Deutsche Schreibschrift. Lesen und Schreiben lernen, München 2000."  ansehen und falls Sie Ihre Fähigkeiten in der Paläographie trainieren möchten, lohnt sich ein Blick auf die Seite des Projektes Alte Schrift des Nationalarchivs Krakau.

*