Implantar um modelo de fluxo de trabalho de orquestração
Artigo
Quando você estiver satisfeito com o desempenho do seu modelo, ele estará pronto para ser implantado e consultá-lo para obter previsões de enunciados. A implantação de um modelo o torna disponível para uso por meio da API de previsão.
Pré-requisitos
Um projeto criado com sucesso
Enunciados rotulados e modelo treinado com sucesso
Depois de analisar o desempenho do modelo e decidir que ele é adequado para ser usado em seu ambiente, você precisa atribuí-lo a uma implantação para poder consultá-lo. A atribuição do modelo a uma implantação o torna disponível para uso por meio da API de previsão. É recomendável criar uma implantação nomeada production à qual você atribui o melhor modelo que você construiu até agora e usá-lo em seu sistema. Você pode criar outra implantação chamada staging à qual você pode atribuir o modelo em que está trabalhando no momento para poder testá-la. Você pode ter um máximo de 10 implantações em seu projeto.
Selecione Implantando um modelo no menu do lado esquerdo.
Selecione Adicionar implantação para iniciar um novo trabalho de implantação.
Selecione Criar nova implantação para criar uma nova implantação e atribuir um modelo treinado na lista suspensa abaixo. Você também pode substituir uma implantação existente selecionando essa opção e selecionando o modelo treinado que deseja atribuir a ela na lista suspensa abaixo.
Nota
A substituição de uma implantação existente não requer alterações na chamada da API de previsão, mas os resultados obtidos serão baseados no modelo recém-atribuído.
Nenhuma configuração é necessária para respostas a perguntas personalizadas ou intenções desvinculadas.
Os projetos LUIS devem ser publicados no slot configurado durante a implantação do Orchestration, e os KBs de resposta a perguntas personalizadas também devem ser publicados em seus slots de produção.
Selecione Implantar para enviar seu trabalho de implantação
Depois que a implantação for bem-sucedida, uma data de expiração aparecerá ao lado dela. A expiração da implantação é quando o modelo implantado não estará disponível para ser usado para previsão, o que normalmente acontece doze meses após a expiração de uma configuração de treinamento.
Enviar trabalho de implantação
Crie uma solicitação PUT usando a seguinte URL, cabeçalhos e corpo JSON para começar a implantar um modelo de fluxo de trabalho de orquestração.
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Corpo do Pedido
{
"trainedModelLabel": "{MODEL-NAME}",
}
Chave
Marcador de Posição
valor
Exemplo
trainedModelLabel
{MODEL-NAME}
O nome do modelo que será atribuído à sua implantação. Você só pode atribuir modelos treinados com sucesso. Esse valor diferencia maiúsculas de minúsculas.
myModel
Depois de enviar sua solicitação de API, você receberá uma 202 resposta indicando sucesso. Nos cabeçalhos de resposta, extraia o operation-location valor. Será formatado da seguinte forma:
Você pode usar essa URL para obter o status do trabalho de implantação.
Obter o status do trabalho de implantação
Use a seguinte solicitação GET para obter o status do seu trabalho de implantação. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.
myProject
{DEPLOYMENT-NAME}
O nome da sua implantação. Esse valor diferencia maiúsculas de minúsculas.
staging
{JOB-ID}
O ID para localizar o status de treinamento do seu modelo. Isso está no valor do location cabeçalho que você recebeu da API em resposta à sua solicitação de implantação de modelo.
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Organismo de resposta
Depois de enviar o pedido, obterá a seguinte resposta. Continue pesquisando este ponto de extremidade até que o parâmetro de status mude para "bem-sucedido".
Depois de concluir o teste de um modelo atribuído a uma implantação, convém atribuí-lo a outra implantação. A troca de implantações envolve:
Pegando o modelo atribuído à primeira implantação e atribuindo-o à segunda implantação.
pegar o modelo atribuído à segunda implantação e atribuí-lo à primeira implantação.
Isso pode ser usado para trocar suas production implantações e staging quando você quiser pegar o modelo atribuído a staging e atribuí-lo ao production.
Para excluir uma implantação do Language Studio, vá para a página Implantar modelo . Selecione a implantação que deseja excluir e selecione Excluir implantação no menu superior.
Crie uma solicitação DELETE usando a seguinte URL, cabeçalhos e corpo JSON para excluir uma implantação de compreensão de linguagem conversacional.
Para atribuir recursos de implantação em outras regiões no Language Studio:
Certifique-se de que se atribuiu como Proprietário de Idiomas dos Serviços Cognitivos ao recurso que utilizou para criar o projeto.
Vá para a página Implantando um modelo no Language Studio.
Selecione a guia Regiões .
Selecione Adicionar recurso de implantação.
Selecione um recurso de idioma em outra região.
Agora você está pronto para implantar seu projeto nas regiões onde atribuiu recursos.
A atribuição de recursos de implantação programaticamente requer autenticação do Microsoft Entra**. O Microsoft Entra ID é usado para confirmar que você tem acesso aos recursos que está interessado em atribuir ao seu projeto para implantação em várias regiões. Para usar programaticamente a autenticação do Microsoft Entra ao fazer chamadas de API REST, consulte a documentação de autenticação de serviços de IA do Azure.
Atribuir recurso
Envie uma solicitação POST usando a seguinte URL, cabeçalhos e corpo JSON para atribuir recursos de implantação.
URL do Pedido
Use a seguinte URL ao criar sua solicitação de API. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O caminho de ID de recurso completo que você deseja atribuir. Encontrado no portal do Azure na guia Propriedades do recurso, dentro do campo ID do Recurso.
O subdomínio personalizado do recurso que você deseja atribuir. Encontrado no portal do Azure na guia Chaves e Ponto Final do recurso, parte do campo Ponto de Extremidade na URL https://<your-custom-subdomain>.cognitiveservices.azure.com/
contosoresource
region
{REGION-CODE}
Um código de região que especifica a região do recurso que você deseja atribuir. Encontrado no portal do Azure na guia Chaves e Ponto Final do recurso, como parte do campo Local/Região .
eastus
Obter o status do recurso atribuído
Use a seguinte solicitação GET para obter o status do seu trabalho de atribuição de recurso de implantação. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.
myProject
{JOB-ID}
O ID do trabalho para obter o status de implantação atribuído. Isso está no valor do operation-location cabeçalho que você recebeu da API em resposta à sua solicitação de recurso de implantação atribuída.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
A versão da API que você está chamando.
2022-10-01-preview
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Organismo de resposta
Depois de enviar o pedido, obterá a seguinte resposta. Continue pesquisando este ponto de extremidade até que o parâmetro de status mude para "bem-sucedido".
Ao cancelar a atribuição ou remover um recurso de implantação de um projeto, você também excluirá todas as implantações que foram implantadas na região desse recurso.
Para cancelar a atribuição ou remoção de recursos de implantação em outras regiões usando o Language Studio:
Vá para a guia Regiões na página Implantar um modelo .
Selecione o recurso que deseja cancelar a atribuição.
Selecione o botão Remover atribuição .
Na janela apresentada, escreva o nome do recurso que pretende remover.
Cancelar atribuição de recurso
Envie uma solicitação POST usando a seguinte URL, cabeçalhos e corpo JSON para cancelar a atribuição ou remover recursos de implantação do seu projeto.
URL do Pedido
Use a seguinte URL ao criar sua solicitação de API. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O caminho de ID de recurso completo que você deseja desatribuir. Encontrado no portal do Azure na guia Propriedades do recurso como o campo ID do Recurso.
Obter o status do recurso para cancelar a atribuição
Use a seguinte solicitação GET para obter o status do seu trabalho de recursos de implantação não atribuído. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.
myProject
{JOB-ID}
O ID do trabalho para obter o status de implantação atribuído. Isso está no valor do operation-location cabeçalho que você recebeu da API em resposta à sua solicitação de recurso de implantação de não atribuição.
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx
{API-VERSION}
A versão da API que você está chamando.
2022-10-01-preview
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Organismo de resposta
Depois de enviar o pedido, obterá a seguinte resposta. Continue pesquisando este ponto de extremidade até que o parâmetro de status mude para "bem-sucedido".