zum Inhalt springen

Dokumente importieren und eine erste Übersicht

Hier sehen Sie das Hauptpanel, von dem aus Sie die wichtigsten Funktionen von Transkribus erreichen können. Von den oben zu sehenden Reitern sind für die Transkription die drei Reiter

  • Server, über den die eigenen Sammlungen verwaltet werden können,
  • Layout, der ein nützliches Werkzeug für die Vorbereitung der Handschriften für die Handwritten Text Recognition darstellt, und
  • Tools, über den die Layout Analysis und die Text Recognition gestartet werden können,

relevant. Auf die einzelnen Reiter wird aber auch noch an den Stellen näher eingegangen werden, an denen sie zum Einsatz kommen.

Zuerst muss jedoch ein Dokument auf die Server von Transkribus importiert werden. Das Beispiel, das im Laufe dieser Übung bearbeitet wird, können Sie hier herunterladen und die einzelnen Schritte der Übung mitmachen.

Ein Klick auf das rot markierte Symbol öffnet das Fenster, in dem Sie den Weg, auf dem Sie eine Datei importieren möchte, auswählen können.

Von den hier zur Verfügung stehenden Möglichkeiten sind am gebräuchlichsten:

  1. Extract and Upload images from pdf
    Dies ist wohl die einfachste Möglichkeit Dokumente auf die Server hochzuladen. Hierbei wählt man eine lokal gespeicherte pdf-Datei aus und die einzelnen Seiten der Datei werden automatisch extrahiert.
     
  2. Upload single document
    Dieser Weg ist ein wenig komplizierter, aber eine praktikable Möglichkeit, um eine größere Menge einzelner Dokumente, die z.B. als .jpg oder .png vorliegen, hochzuladen. Dies kann z.B. der Fall sein, wenn man mehrere Seiten einer Handschrift mit dem Handy fotografiert hat. Bei diesem Weg wird ein lokal gespeicherter Ordner ausgewählt und der Inhalt importiert. Zu beachten ist hierbei, dass sich bis auf die Bilder, die importiert werden sollen, nichts anderes in dem Ordner befinden darf, da ansonsten der Vorgang vollständig abgebrochen wird.

Da das Beispieldokument eine pdf-Datei ist, können Sie den ersten der beiden hier genannten Wege auswählen.

Unter Add to collection können Sie noch auswählen, in welche Sammlung die Datei hochgeladen werden soll oder es kann eine neue Sammlung erstellt werden. So können Sie jedes Ihrer Projekte in einer eigenen Sammlung organisieren.

Abhängig davon wie viele Dokumente hochgeladen werden, kann dieser Prozess eine Weile dauern. Wenn Sie oben neben dem Symbol für das Importieren von Dateien auf die Kaffeetasse klicken, können sie überprüfen welche Prozesse momentan von Transkribus ausgeführt werden. Auch wenn Transkribus Sie über das Ende des Importes benachrichtigt hat, kann es sein, dass Sie die Dokumente nicht in Ihrer Sammlung finden können. Dagegen hilft es in regelmäßigen Abständen den Sammlungsordner erneut zu laden (klicken Sie hierfür auf die Schaltfläche neben Collections: und wählen Sie die jeweilige Sammlung aus) bis ihre Dokumente angezeigt werden.