Comprendere quando ottimizzare un modello di base

Completato

Usando modelli di base con training preliminare open source, è possibile salvare le risorse. In alcuni casi, potrebbe essere necessario ottimizzare un modello di base per soddisfare le esigenze specifiche.

Esplorare i modelli di base nel catalogo dei modelli

I modelli di base sono modelli di Machine Learning di grandi dimensioni già sottoposti a training per fungere da base per un'ampia gamma di casi d'uso.

In Azure Machine Learning è possibile esplorare modelli di base open source eseguendo una ricerca nel catalogo dei modelli. Il tipo di modello di base necessario dipende da ciò per cui si vuole usare il modello.

In generale, i modelli di base vengono sottoposti a training su grandi quantità di dati ed Excel per eseguire attività generiche come la comprensione del linguaggio, la generazione di testo e la stima del contesto. Tuttavia, potrebbero non essere la scelta migliore se è necessario un modello personalizzato per un'attività o un dominio specifico. In questi casi, l'ottimizzazione del modello di base sui dati specifici dell'attività può aiutare a soddisfare i requisiti specifici e ottenere risultati migliori.

Ottimizzazione dei modelli di base per attività specifiche

Anche se i modelli di base possono già soddisfare i requisiti, potrebbe essere necessario ottimizzare un modello di base.

I modelli di base vengono sottoposti a training preliminare su una vasta gamma di testo da Internet, rendendoli esperti nella comprensione generale del linguaggio. Tuttavia, l'ottimizzazione consente di personalizzare le conoscenze del modello in base a un'attività o a un dominio specifico, ottimizzandone le prestazioni e assicurandosi che eccelle in quel particolare contesto.

Alcune attività comuni per cui è possibile ottimizzare un modello di base sono:

  • Classificazione del testo: categorizzazione di un testo specificato in classi o categorie predefinite in base al contenuto o al contesto.
  • Classificazione dei token: assegnazione di etichette o tag specifici a singoli token o parole in un testo, spesso usati in attività come il riconoscimento di entità denominate.
  • Risposta alle domande: fornire risposte accurate e pertinenti alle domande poste nel linguaggio naturale.
  • Riepilogo: creazione di riepiloghi concisi e coerenti di testi più lunghi, acquisendo le informazioni essenziali.
  • Traduzione: conversione di testo da una lingua a un'altra mantenendo il significato e il contesto.

Poiché i modelli di base sono già sottoposti a training preliminare, è necessario un set di dati specifico dell'attività più piccolo per ottimizzare un modello di base. Quando si ottimizza un modello, è probabile che siano necessari meno dati e calcoli rispetto a quando si esegue il training di un modello da zero.

È possibile ottimizzare un modello di base del catalogo dei modelli in Azure Machine Learning. Per ottimizzare un modello, sono necessari solo un set di dati di piccole dimensioni e un cluster GPU.