Distribuire modelli di intelligenza artificiale generativa

Completato

È prima necessario distribuire un modello per chattare con o effettuare chiamate API per ricevere risposte alle richieste. Quando si crea una nuova distribuzione, è necessario indicare quale modello di base distribuire. È possibile distribuire un numero qualsiasi di distribuzioni in una o più risorse OpenAI di Azure, purché i relativi token al minuto (TPM) rimangano entro la quota di distribuzione.

Distribuire con Azure AI Studio

Nella pagina Distribuzioni di Azure AI Studio è possibile creare una nuova distribuzione selezionando un nome di modello dal menu. I modelli di base disponibili provengono dall'elenco nella pagina dei modelli.

Screenshot della distribuzione guidata del modello del portale di Azure AI Studio.

Nella pagina Distribuzioni di Studio è anche possibile visualizzare informazioni su tutte le distribuzioni, tra cui nome della distribuzione, nome del modello, versione del modello, stato, data di creazione e altro ancora.

Eseguire la distribuzione usando l'interfaccia della riga di comando di Azure

È anche possibile distribuire un modello usando la console. Usando questo esempio, sostituire le variabili seguenti con i valori delle proprie risorse:

  • OAIResourceGroup: sostituire con il nome del gruppo di risorse
  • MyOpenAIResource: sostituire con il nome della risorsa
  • MyModel: sostituire con un nome univoco per il modello
  • gpt-35-turbo: sostituire con il modello di base da distribuire
az cognitiveservices account deployment create \
   -g OAIResourceGroup \
   -n MyOpenAIResource \
   --deployment-name MyModel \
   --model-name gpt-35-turbo \
   --model-version "0301"  \
   --model-format OpenAI \
   --sku-name "Standard" \
   --sku-capacity 1

Distribuire tramite l'API REST

È possibile distribuire un modello usando l'API REST. Nel corpo della richiesta specificare il modello di base da distribuire. Vedere un esempio nella documentazione di Azure OpenAI.