Quale modello usare
È necessario prendere in considerazione molti fattori, tra cui costi, disponibilità, prestazioni e funzionalità, quando si sceglie un modello linguistico di grandi dimensioni da utilizzare. È consigliabile in genere attenersi alle linee guida seguenti:
gpt-35-turbo: Questo modello è economico, funziona bene e, nonostante il nome ChatGPT, può essere usato per un'ampia gamma di attività oltre chat e conversazione.
gpt-35-turbo-16k, gpt-4 o gpt-4-32k: Questi modelli costituiscono una buona scelta se è necessario generare più di 4.096 token o se è necessario supportare prompt più grandi. Questi modelli tuttavia sono più costosi, possono essere più lenti e potrebbero avere una disponibilità limitata.
Modelli di incorporamento: Se le attività includono ricerca, clustering, raccomandazioni e rilevamento anomalie, è consigliabile usare un modello di incorporamento. I computer possono usare facilmente un vettore di numeri che formano l'incorporamento. L'incorporamento è una rappresentazione ricca di informazioni del significato semantico di un testo. La distanza tra due incorporamenti nello spazio vettoriale è correlata alla somiglianza semantica. Ad esempio, se due testi sono simili, anche le relative rappresentazioni sono simili.
DALL-E: Questo strumento genera immagini partendo da prompt in formato testuale. DALL-E differisce da altri modelli linguistici perché l'output è un'immagine e non un testo.
Whisper: Il training di questo modello viene eseguito su un set di dati di grandi dimensioni di audio e testo in inglese. Whisper è ottimizzato per le funzionalità di conversione della voce in testo scritto, ad esempio la trascrizione di file audio. Può essere usato per trascrivere file audio che contengono parlato in lingue diverse dall'inglese, tuttavia l'output del modello è un testo in inglese. Usare Whisper per trascrivere i file audio uno alla volta rapidamente, per tradurre l'audio da altre lingue in inglese o fornire il prompt al modello per guidare l'output.