Lingue supportate dall’analisi testuale personalizzata per la salute
Questo articolo fornisce informazioni sulle lingue attualmente supportate dall’analisi testuale personalizzata per la salute.
Opzione multilingue
L’analisi testuale personalizzata per la salute permette di eseguire il training di un modello in una lingua e usarlo per estrarre entità da documenti in altre lingue. Questa funzionalità evita che sia necessario creare progetti diversi in ogni lingua e consente invece di combinare i set di dati in un singolo progetto, semplificando così la scalabilità dei progetti in più lingue. È possibile eseguire il training del progetto solo con documenti in inglese ed eseguire query sul progetto in: francese, tedesco, italiano e altre lingue. È possibile abilitare l'opzione multilingue durante il processo di creazione del progetto o successivamente tramite le impostazioni del progetto.
Non è previsto che si aggiunga lo stesso numero di documenti per ogni lingua. È preferibile creare la maggior parte del progetto in un’unica lingua e aggiungere solo alcuni documenti nelle lingue le cui prestazioni sono insoddisfacenti. Se si crea un progetto principalmente in inglese e si inizia a testarlo in francese, tedesco e spagnolo, si potrebbe rilevare che le prestazioni per il tedesco non sono soddisfacenti come per le altre due lingue. In tal caso, valutare la possibilità di aggiungere il 5% dei documenti originali in inglese in tedesco, eseguire il training di un nuovo modello e ripetere i test per il tedesco. Nella pagina di etichettatura dati in Language Studio, è possibile selezionare la lingua del documento che viene aggiunto. In tal modo, i risultati delle query in tedesco dovrebbero migliorare. Maggiore è il numero di documenti etichettati aggiunti, maggiori sono le probabilità di ottenere risultati migliori. Quando si aggiungono dati in un'altra lingua, non è previsto un impatto negativo su altre lingue.
L'ebraico non è supportato nei progetti multilingue. Se la lingua principale del progetto è l’ebraico, non sarà possibile aggiungere dati di training in altre lingue o eseguire query sul modello in altre lingue. Analogamente, se la lingua principale del progetto non è l’ebraico, non sarà possibile aggiungere dati di training in ebraico o eseguire query sul modello in ebraico.
Supporto di versioni in lingue diverse
Analisi testuale personalizzata per la salute supporta i .txt
file nelle lingue seguenti:
Lingua | Codice lingua |
---|---|
Inglese | en |
Francese | fr |
Tedesco | de |
Spagnolo | es |
Italiano | it |
Portoghese (Portogallo) | pt-pt |
Ebraico | he |