1. Addestramento di modelli di riconoscimento del testo

La piattaforma Transkribus consente agli utenti di addestrare modelli di riconoscimento del testo per trascrivere automaticamente i loro documenti

Un modello di riconoscimento del testo è un algoritmo di intelligenza artificiale addestrato su un certo numero di dati (immagini e trascrizioni), in grado di individuare la sequenza di caratteri più probabile per ogni riga di testo segmentata.

Molti modelli pubblici, addestrati dalla comunità di Transkribus, sono già disponibili e possono essere usati da ogni utente di Transkribus, come spiegato in questa pagina.

Tuttavia, se nessun modello pubblico funziona bene con i vostri documenti, potete addestrare un modello di riconoscimento del testo specifico per riconoscere la scrittura dei vostri documenti. I modelli di riconoscimento del testo possono essere addestrati per qualsiasi lingua e scrittura, di qualsiasi periodo e luogo.

Sulla base delle immagini dei documenti e le loro trascrizioni accurate, il modello imparerà a riconoscere lo stile di scrittura dei vostri documenti con un certo grado di precisione.

 

Passo successivo: Preparazione dei dati