Implante modelos de IA generativa
Primeiro, você precisa implantar um modelo para conversar ou fazer chamadas de API para receber respostas a prompts. Ao criar uma nova implantação, você precisa indicar qual modelo base implantar. Você pode implantar qualquer número de implantações em um ou vários recursos do Azure OpenAI, desde que seus Tokens por Minuto (TPM) permaneçam dentro da cota de implantação.
Implantar usando o Azure AI Studio
Na página Implantações do Azure AI Studio, você pode criar uma nova implantação selecionando um nome de modelo no menu. Os modelos base disponíveis vêm da lista na página de modelos.
Na página Implantações no Studio, você também pode exibir informações sobre todas as suas implantações, incluindo nome da implantação, nome do modelo, versão do modelo, status, data de criação e muito mais.
Implementar com a CLI do Azure
Você também pode implantar um modelo usando o console. Usando este exemplo, substitua as seguintes variáveis por seus próprios valores de recurso:
- OAIResourceGroup: substitua pelo nome do seu grupo de recursos
- MyOpenAIResource: substitua pelo nome do seu recurso
- MyModel: substitua por um nome exclusivo para o seu modelo
- GPT-35-Turbo: Substitua pelo modelo base que deseja implantar
az cognitiveservices account deployment create \
-g OAIResourceGroup \
-n MyOpenAIResource \
--deployment-name MyModel \
--model-name gpt-35-turbo \
--model-version "0301" \
--model-format OpenAI \
--sku-name "Standard" \
--sku-capacity 1
Implantar usando a API REST
Você pode implantar um modelo usando a API REST. No corpo da solicitação, você especifica o modelo base que deseja implantar. Veja um exemplo na documentação do Azure OpenAI.