1. Texterkennungsmodelle trainieren

Die Transkribus-Plattform ermöglicht es Benutzern, Texterkennungsmodelle zu trainieren, um ihre Dokumente automatisch zu transkribieren

Ein Texterkennungsmodell ist ein KI-Algorithmus, der auf eine bestimmte Anzahl von Daten (Bilder und Transkriptionen) trainiert wird und in der Lage ist, die wahrscheinlichste Zeichenfolge für jede segmentierte Textzeile zu erkennen.

Viele öffentliche Modelle, die von der Transkribus-Community trainiert wurden, sind bereits verfügbar und können von jedem Transkribus-Benutzer verwendet werden, wie auf dieser Seite erklärt.

Wenn jedoch kein öffentliches Modell für Ihre Dokumente gut funktioniert, können Sie ein benutzerdefiniertes Texterkennungsmodell trainieren, um das spezifische Skript Ihrer Dokumente zu erkennen. Texterkennungsmodelle können für jede Sprache und Schrift zu jeder Zeit und an jedem Ort trainiert werden.

Indem dem Modell Bilder von Dokumenten und deren genaue Transkriptionen gezeigt werden, lernt es, den Schreibstil Ihrer Dokumente mit einem gewissen Grad an Genauigkeit zu erkennen.

Nächster Schritt: Vorbereiten von Trainingsdaten