1. Help Center
  2. Riconoscimento del testo

1. Trascrizione automatica dei documenti

Applica il riconoscimento del testo ai documenti per trascriverli automaticamente

Fase precedente: Caricamento dei file


Per trascrivere automaticamente i documenti, è necessario innanzitutto selezionare le pagine o i documenti che si desidera trascrivere. Quindi, cliccare su "Riconoscimento del testo" nel menu di sinistra, sotto "Tools".

Ora scegliete il modello di testo più appropriato per i vostri documenti.

Un modello di testo è un algoritmo di intelligenza artificiale addestrato su un certo numero di dati (immagini e trascrizioni), in grado di individuare la sequenza di caratteri più probabile per ogni riga di testo segmentata. Non esiste un modello generale per tutte le grafie, quindi è necessario scegliere quello più appropriato per la scrittura e la lingua dei documenti.

All'interno di Transkribus, è possibile selezionare sia i modelli pubblici messi a disposizione dalla comunità e dal team di Transkribus, sia i modelli privati formati da voi stessi. È possibile filtrare la ricerca in base alla lingua, al nome, al tipo di documenti...

Due opzioni aggiuntive che è possibile selezionare prima di lanciare il riconoscimento del testo sono:

  • Smart Search: consente di eseguire un tipo di ricerca più avanzato e potente delle trascrizioni generate automaticamente. Per saperne di più, consultate la pagina Smart Search.
  • Modello linguistico: viene creato automaticamente durante l'addestramento del modello e si basa sui dati di addestramento. L'effetto dei modelli linguistici deve essere testato nel singolo caso: in molti casi, sono in grado di migliorare il riconoscimento, ma finora ci sono anche casi in cui non lo fanno.

Dopo aver selezionato il modello e le eventuali opzioni, cliccare sul pulsante "Start" per avviare il riconoscimento. È possibile verificare lo stato del riconoscimento del testo facendo clic su "Lavori". Al termine del riconoscimento, aprire una pagina riconosciuta: la trascrizione generata automaticamente apparirà sul lato destro dello schermo.

Quando si avvia il riconoscimento del testo, le immagini vengono segmentate automaticamente in regioni e linee di testo. Questa fase, chiamata riconoscimento del layout, collega il testo e l'immagine. Se i documenti hanno un layout complesso (ad esempio, tabelle, giornali, cartoline, margini, colonne multiple...), potrebbe essere conveniente eseguire il riconoscimento del layout come fase separata per controllarlo e correggerlo prima del riconoscimento del testo. Se questo è il vostro caso, date un'occhiata alla sezione Riconoscimento del layout.

Le sezioni seguenti trattano in modo più dettagliato gli aspetti principali del riconoscimento testuale e come scegliere il modello migliore per i propri documenti.

 

La prossima sezione: Scelta del modello

 


 

Transkribus eXpert (deprecato)

Per trascrivere automaticamente i documenti, accedere alla scheda "Strumenti", sotto la sezione "Riconoscimento del testo" e fare clic sul pulsante "Esegui". Nella finestra a comparsa, scegliere le pagine/documenti da elaborare e fare clic su "Seleziona modello HTR". Qui è possibile scegliere il modello di testo più appropriato per i propri documenti. 

Un modello di testo è un algoritmo di intelligenza artificiale addestrato su un certo numero di dati (immagini e trascrizioni), in grado di individuare la sequenza di caratteri più probabile per ogni riga di testo segmentata. Non esiste un modello generale per tutte le grafie, quindi è necessario scegliere quello più appropriato per la scrittura e la lingua dei propri documenti.

È possibile selezionare sia i modelli pubblici messi a disposizione dalla comunità e dal team di Transkribus, sia i modelli privati formati da voi stessi. È possibile filtrare la ricerca per motore, lingua e nome. 

Le impostazioni avanzate che si possono selezionare sono:

  • Usa poligoni di linea esistenti: utilizzare questa opzione se si sono corretti manualmente i poligoni di linea perché il calcolo dei poligoni dalle linee di base non ha funzionato bene sui documenti.
  • Semplificare i poligoni: per ridurre il numero di punti dei poligoni di linea.
  • Aggiungi le coordinate stimate delle parole: aggiungi dei riquadri di delimitazione approssimativi per ogni parola della riga (puoi poi decidere di mostrare/nascondere i riquadri delle parole con l'icona a forma di occhio nella barra principale in alto).
  • Restrizione su tag struttura: limita il riconoscimento del testo solo alle regioni di testo etichettate con il tag strutturale selezionato. Si può decidere se mantenere o eliminare il testo nelle altre regioni.

Dopo aver selezionato il modello, fare clic su "OK" per avviare il riconoscimento. È possibile verificare lo stato del riconoscimento del testo facendo clic sul pulsante "Lavori" nella barra principale superiore. Al termine del riconoscimento, ricaricare la pagina: la trascrizione generata automaticamente apparirà nell'editor di testo, 

Quando si avvia il riconoscimento del testo, le immagini vengono segmentate automaticamente in regioni e linee di testo. Questa fase, chiamata riconoscimento del layout, collega il testo e l'immagine. Se i documenti hanno un layout complesso (ad esempio, tabelle, giornali, cartoline, margini, colonne multiple...), potrebbe essere conveniente eseguire il riconoscimento del layout come fase separata per controllarlo e correggerlo prima del riconoscimento del testo. Se questo è il vostro caso, date un'occhiata a questa pagina.