Distribuire modelli di intelligenza artificiale generativa
È prima necessario distribuire un modello per chattare con o effettuare chiamate API per ricevere risposte alle richieste. Quando si crea una nuova distribuzione, è necessario indicare quale modello di base distribuire. È possibile distribuire un numero qualsiasi di distribuzioni in una o più risorse OpenAI di Azure, purché i relativi token al minuto (TPM) rimangano entro la quota di distribuzione.
Distribuire con Azure AI Studio
Nella pagina Distribuzioni di Azure AI Studio è possibile creare una nuova distribuzione selezionando un nome di modello dal menu. I modelli di base disponibili provengono dall'elenco nella pagina dei modelli.
Nella pagina Distribuzioni di Studio è anche possibile visualizzare informazioni su tutte le distribuzioni, tra cui nome della distribuzione, nome del modello, versione del modello, stato, data di creazione e altro ancora.
Eseguire la distribuzione usando l'interfaccia della riga di comando di Azure
È anche possibile distribuire un modello usando la console. Usando questo esempio, sostituire le variabili seguenti con i valori delle proprie risorse:
- OAIResourceGroup: sostituire con il nome del gruppo di risorse
- MyOpenAIResource: sostituire con il nome della risorsa
- MyModel: sostituire con un nome univoco per il modello
- gpt-35-turbo: sostituire con il modello di base da distribuire
az cognitiveservices account deployment create \
-g OAIResourceGroup \
-n MyOpenAIResource \
--deployment-name MyModel \
--model-name gpt-35-turbo \
--model-version "0301" \
--model-format OpenAI \
--sku-name "Standard" \
--sku-capacity 1
Distribuire tramite l'API REST
È possibile distribuire un modello usando l'API REST. Nel corpo della richiesta specificare il modello di base da distribuire. Vedere un esempio nella documentazione di Azure OpenAI.