6. Tabellen

Segmentieren Sie die Tabellenstruktur manuell, bevor Sie die Layout-Erkennung ausführen, um Linien zu erkennen

Vorheriger Schritt: Manuelle Layout-Erkennung

Wenn Ihre Dokumente Tabellen enthalten, besteht der beste aktuelle Ansatz darin, die Tabellenstruktur manuell auf den Seiten zu zeichnen und dann die automatische Zeilenerkennung mit der Option "Layout Recognition" auszuführen.

Wenn das Tabellenlayout mehrerer Seiten ähnlich ist, ist es möglich, die Tabellenstruktur von einer Seite auf eine andere zu kopieren und einzufügen. 

Öffnen Sie zunächst eine Seite und wählen Sie die Schaltfläche "Tabelle hinzufügen" links im Bild. Klicken Sie einmal auf das Bild, um den Tisch zu starten und einmal, um ihn zu beenden. Drücken Sie ESC oder den Auswahlmodus, um den Modus "Tisch hinzufügen" zu verlassen.

Um Zeilen zu erstellen, wählen Sie die Tabelle aus und halten Sie H gedrückt, während Sie den Cursor über die Seite bewegen und klicken, wohin Sie eine Zeile erstellen möchten.
Um Spalten zu erstellen, halten Sie V gedrückt, während Sie den Cursor über die Seite bewegen und klicken, wo Sie eine Spalte erstellen möchten. Fahren Sie auf diese Weise fort, bis alle Zellen markiert sind.

Wenn Sie zwei benachbarte Zellen oder alle Zellen einer Zeile/Spalte zusammenführen möchten, wählen Sie die Form aus und klicken Sie mit der rechten Maustaste: Verwenden Sie die Optionen im Kontextmenü, um die Zellen zusammenzuführen.

Abhängig vom Layout Ihres Tisches können Sie den Buchrücken wie eine zusätzliche Spalte behandeln. Sie können diese Spalte auch mit einem strukturellen Tag markieren (z. B. "Buchbinden" ): Markieren Sie die Spalte, klicken Sie mit der rechten Maustaste und wählen Sie im Kontextmenü "Strukturtyp zuweisen". Lesen Sie die Struktur-Tags Seite für weitere Informationen zum Verwalten und Erstellen neuer struktureller Tags.

Wenn auf der Seite andere Informationen angezeigt werden, die nicht zur Tabelle gehören (z. B. Überschrift, Seitennummer, Anmerkungen usw.), zeichnen Sie Textbereiche um sie herum. 

Oft folgen mehrere Seiten der gleichen Tabellenvorlage. Nachdem Sie die tabellarische Struktur auf der ersten Seite gezeichnet haben, wählen Sie sie und alle anderen Textbereiche aus, drücken Sie STRG+C, um die gewünschten Formen zu kopieren, wechseln Sie zu einer anderen Seite und drücken Sie STRG+V, um sie einzufügen. Möglicherweise sind einige Anpassungen erforderlich: Halten Sie die UMSCHALT-Taste gedrückt, um die Formen zu VERSCHIEBEN und zu skalieren, oder bewegen Sie den Cursor auf die Linie, die Sie verschieben möchten, klicken Sie darauf und lassen Sie ihn an der neuen Position los.

Sobald Sie die Tabellenstruktur auf allen Seiten erstellt haben, gehen Sie zurück zur Dokumentansicht und führen Layout-Erkennung aus, um Zeilen automatisch hinzuzufügen. Denken Sie daran, das Kontrollkästchen "Find Text Regions" in den Einstellungen zu deaktivieren, um nur die Zeilen zu erkennen.

Wenn Zeilen, die zu verschiedenen Zellen gehören, sehr nahe beieinander liegen, kann es sein, dass die automatische Layout-Erkennung sie als eine einzige lange Zeile erkennt. Um dies zu verhindern und dafür zu sorgen, dass sich die Linien strikt an den Zellrand halten, aktivieren Sie die Option "Linien am Rand des Bereichs aufteilen" in den Einstellungen der Layout-Erkennung.

Im Gegenteil, es kann vorkommen, dass Zeilen, die sich über mehrere Zellen erstrecken, geteilt werden. Sie können diese Teillinien zusammenführen, aber zuerst müssen Sie sie in dieselbe Zelle verschieben. Öffnen Sie den Layout-Baum mit der Schaltfläche "Layout" im linken Menü und wählen Sie im Bild die Zeile aus, die zur falschen Zelle gehört: automatisch wird die entsprechende Zeile im Layout-Baum hervorgehoben. Verschieben Sie die hervorgehobene Zeile innerhalb des Layout-Baums in die rechte Zelle (wahrscheinlich die vorherige oder folgende Zelle). Nun, da beide Zeilen zur gleichen Zelle gehören, können Sie die STRG-Taste gedrückt halten, beide Zeilen markieren und M auf Ihrer Tastatur drücken, um sie zusammenzuführen.


 

Transkribus eXpert (veraltet)

Wenn Sie gedruckte oder handgezeichnete Tabellen mit dem Tabelleneditor in Transkribus segmentieren, werden Ihrem Bild grafische Linien hinzugefügt und dem Layout Ihrer Dokumente eine Tabellenstruktur zugewiesen.

Derzeit müssen Tabellen manuell mit dem Tabelleneditor in Transkribus gezeichnet werden. Wenn jedoch mehrere Seiten der gleichen Tabellenvorlage folgen, kann das Tabellen-Markup auf der ersten Seite durchgeführt und dann auf die übrigen Seiten kopiert werden.

Erstellen Sie zuerst Textbereiche für alle Informationen, die nicht zur Tabelle gehören.
Dies bezieht sich auf Informationen oben, unten oder an den Seiten der Seite, die eindeutig nicht Teil der Tabelle sind, wie Seitenzahlen, Zeilennummern, Daten und andere Markierungen oder Anmerkungen.

Dann können Sie die Tabelle erstellen. Wählen Sie im Canvas-Menü die Schaltfläche „Add other item“ (Weitere Elemente hinzufügen) und klicken Sie dann auf „Add a table“ (Eine Tabelle hinzufügen). Klicken Sie auf die obere linke Ecke der Tabelle im Bild und dann auf die untere rechte Ecke

Sie können Ihre Tabelle jetzt in Zeilen und Spalten segmentieren. Stellen Sie zunächst sicher, dass Sie sich im „Auswahlmodus“ befinden: Drücken Sie die Taste „ESC“ auf Ihrer Tastatur oder klicken Sie im Hauptmenü auf die Schaltfläche „Auswahlmodus“. Klicken Sie auf die Tabelle, die Sie erstellt haben.

Um Zeilen zu erstellen, klicken Sie im Menü Leinwand auf die Schaltfläche H: Bewegen Sie den Cursor über die Seite und klicken Sie, wo Sie eine horizontale Linie erstellen möchten.
Um Spalten zu erstellen, klicken Sie im Menü Leinwand auf die Schaltfläche V: Bewegen Sie den Cursor über die Seite und klicken Sie, wo Sie eine vertikale Linie erstellen möchten. Fahren Sie fort, bis alle Tabellenzellen markiert sind.

In einigen Fällen kann es erforderlich sein, Zellen zusammenzuführen, um Zellen zu reflektieren, die sich über mehrere Zeilen oder Spalten erstrecken. Um Zellen auszuwählen, die zusammengeführt werden sollen, halten Sie die Taste „STRG/cmd“ auf Ihrer Tastatur gedrückt, klicken Sie auf die entsprechenden Zellen in Ihrer Tabelle und dann auf die Schaltfläche „Zusammenführen der ausgewählten Formen“ im Leinwandmenü.

Wenn Sie sich auf die perfekte Tabellensegmentierung konzentrieren, kann es auch erforderlich sein, die Formen einiger Zellen in Ihrer Tabelle zu korrigieren. Die segmentierten grünen Linien sollten dann so weit wie möglich den Linien Ihrer Tabelle entsprechen. Wählen Sie dazu die Tabellenzelle aus, die Sie bearbeiten möchten, klicken und ziehen Sie die grünen Punkte, um die Position der Linien zu verschieben.

Abhängig vom Layout Ihres Tisches können Sie den Buchrücken wie eine zusätzliche Spalte behandeln. Sie können diese Spalte auch auf Tabellenzellebene mit dem Tag „Buchbinden“ auf der Registerkarte „Metadaten/Struktur“ markieren.

Wenn das Tabellenlayout mehrerer Seiten ähnlich ist, kann das Tabellenformat von einer Seite auf eine andere übertragen werden. Öffnen Sie dazu im Leinwandmenü „Weitere Segmentierungstools“, wählen Sie „Regionen (Texte oder Tabellen) auf andere Seiten kopieren“, definieren Sie im erscheinenden Fenster die Seiten, auf die das Layout kopiert werden soll, und bestätigen Sie mit „OK“. Das Tabellenlayout wird auf die angegebenen Seiten kopiert. Um das Tool auf jeden Fall zu starten, deaktivieren Sie „Probelauf“. Es kann sein, dass die Position der Tabelle auf den neuen Seiten korrekt sein muss. Markieren Sie dazu die gesamte Tabelle und verschieben Sie sie, indem Sie die TASTENKOMBINATION STRG + UMSCHALT auf Ihrer Tastatur gedrückt halten.

Bevor Sie die Tabelle manuell oder automatisch transkribieren, ist der nächste Schritt das Hinzufügen von Basislinien. Die Grundlinien sollten den logischen Textfluss widerspiegeln und können daher bei Bedarf über die Zellgrenzen verlaufen. Sie können die Basislinien entweder von Hand zeichnen oder das automatische Layout-Analyse-Tool verwenden.

Sie können feststellen, dass das automatische Layout-Werkzeug für Tabellenzellen die Zellgrenzen strikt befolgt. Baselines, die mehrere Zellen strecken, werden geteilt. Sie können das Zusammenführungstool verwenden, um diese partiellen Basislinien zu kombinieren. Wenn Sie Grundlinien zusammenführen möchten, die sich über mehr als eine Zelle erstrecken, müssen Sie sie zuerst in dieselbe Zelle verschieben, sie auswählen und das Zusammenführungstool verwenden. Genauer gesagt, öffnen Sie die Registerkarte „Layout“ in der Tools& -Verwaltungsleiste und wählen Sie im Bild die Zeile aus, die zur falschen Zelle gehört: automatisch wird die entsprechende Zeile im Layout-Baum hervorgehoben. Verschieben Sie die hervorgehobene Zeile innerhalb des Layout-Baums in die rechte Zelle (wahrscheinlich die vorherige oder folgende Zelle). Nun, da beide Linien zu derselben Zelle gehören, können Sie beide auswählen und im Leinwandmenü auf die Schaltfläche „Merges the selected shapes“ (Die ausgewählten Formen zusammenführen) klicken.