Treine seu modelo de fluxo de trabalho de orquestração
Artigo
O treinamento é o processo em que o modelo aprende com seus enunciados rotulados. Após a conclusão do treinamento, você poderá visualizar o desempenho do modelo.
Para treinar um modelo, inicie um trabalho de treinamento. Somente trabalhos concluídos com êxito criam um modelo. Os trabalhos de formação expiram após sete dias, após este período já não poderá recuperar os detalhes do trabalho. Se o seu trabalho de treinamento foi concluído com êxito e um modelo foi criado, ele não será afetado pela expiração do trabalho. Você só pode ter um trabalho de treinamento em execução de cada vez, e você não pode iniciar outros trabalhos no mesmo projeto.
Os tempos de treinamento podem ser de alguns segundos ao lidar com projetos simples, até algumas horas quando você atinge o limite máximo de enunciados.
A avaliação do modelo é acionada automaticamente após a conclusão bem-sucedida do treinamento. O processo de avaliação começa usando o modelo treinado para executar previsões sobre os enunciados no conjunto de testes, e compara os resultados previstos com os rótulos fornecidos (que estabelece uma linha de base de verdade). Os resultados são retornados para que você possa analisar o desempenho do modelo.
Pré-requisitos
Um projeto criado com êxito com uma conta de armazenamento de blob do Azure configurada
Antes de iniciar o processo de treinamento, os enunciados rotulados em seu projeto são divididos em um conjunto de treinamento e um conjunto de testes. Cada um deles tem uma função diferente.
O conjunto de treinamento é usado no treinamento do modelo, este é o conjunto a partir do qual o modelo aprende os enunciados rotulados.
O conjunto de testes é um conjunto cego que não é introduzido no modelo durante o treinamento, mas apenas durante a avaliação.
Depois que o modelo é treinado com sucesso, o modelo pode ser usado para fazer previsões a partir dos enunciados no conjunto de testes. Essas previsões são usadas para calcular métricas de avaliação.
Recomenda-se certificar-se de que todas as suas intenções estão adequadamente representadas no conjunto de treinamento e teste.
O fluxo de trabalho de orquestração suporta dois métodos para divisão de dados:
Dividir automaticamente o conjunto de testes dos dados de treinamento: o sistema dividirá seus dados marcados entre os conjuntos de treinamento e teste, de acordo com as porcentagens que você escolher. A divisão percentual recomendada é de 80% para treinamento e 20% para testes.
Nota
Se você escolher a opção Dividir automaticamente o conjunto de testes dos dados de treinamento , somente os dados atribuídos ao conjunto de treinamento serão divididos de acordo com as porcentagens fornecidas.
Use uma divisão manual de dados de treinamento e teste: esse método permite que os usuários definam quais enunciados devem pertencer a qual conjunto. Esta etapa só será habilitada se você tiver adicionado expressões ao conjunto de testes durante a rotulagem.
Nota
Você só pode adicionar enunciados no conjunto de dados de treinamento apenas para intenções não conectadas.
Selecione Trabalhos de treinamento no menu do lado esquerdo.
Selecione Iniciar um trabalho de treinamento no menu superior.
Selecione Treinar um novo modelo e digite o nome do modelo na caixa de texto. Você também pode substituir um modelo existente selecionando essa opção e escolhendo o modelo que deseja substituir no menu suspenso. A substituição de um modelo treinado é irreversível, mas não afetará os modelos implantados até que você implante o novo modelo.
Dividir automaticamente o conjunto de testes dos dados de treinamento: Seus enunciados marcados serão divididos aleatoriamente entre os conjuntos de treinamento e teste, de acordo com as porcentagens que você escolher. A divisão percentual padrão é de 80% para treinamento e 20% para testes. Para alterar esses valores, escolha qual conjunto deseja alterar e digite o novo valor.
Nota
Se você escolher a opção Dividir automaticamente o conjunto de testes dos dados de treinamento , somente os enunciados em seu conjunto de treinamento serão divididos de acordo com as porcentagens fornecidas.
Use uma divisão manual de dados de treinamento e teste: atribua cada enunciado ao conjunto de treinamento ou teste durante a etapa de marcação do projeto.
Nota
A opção Usar uma divisão manual de dados de treinamento e teste só será habilitada se você adicionar enunciados ao conjunto de testes na página de dados da tag. Caso contrário, será desativado.
Selecione o botão Trem .
Nota
Apenas trabalhos de formação concluídos com sucesso gerarão modelos.
O treinamento pode levar algum tempo entre alguns minutos e algumas horas com base no tamanho dos dados marcados.
Só pode ter um trabalho de preparação em execução de cada vez. Você não pode iniciar outro trabalho de treinamento no mesmo projeto até que o trabalho em execução seja concluído.
Crie uma solicitação POST usando a seguinte URL, cabeçalhos e corpo JSON para enviar um trabalho de treinamento.
URL do Pedido
Use a seguinte URL ao criar sua solicitação de API. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
Modo de treino. Apenas um modo de treinamento está disponível em orquestração, que é standard.
standard
trainingConfigVersion
{CONFIG-VERSION}
A versão do modelo de configuração de treinamento. Por padrão, a versão mais recente do modelo é usada.
2022-05-01
kind
percentage
Métodos de divisão. Os valores possíveis são percentage ou manual. Veja como treinar um modelo para obter mais informações.
percentage
trainingSplitPercentage
80
Porcentagem dos dados marcados a serem incluídos no conjunto de treinamento. O valor recomendado é 80.
80
testingSplitPercentage
20
Porcentagem dos dados marcados a serem incluídos no conjunto de testes. O valor recomendado é 20.
20
Nota
O trainingSplitPercentage e testingSplitPercentage só são necessários se Kind for definido como percentage e a soma de ambas as percentagens deve ser igual a 100.
Depois de enviar sua solicitação de API, você receberá uma 202 resposta indicando sucesso. Nos cabeçalhos de resposta, extraia o operation-location valor. Será formatado da seguinte forma:
Selecione o ID do trabalho de treinamento na lista, um painel lateral aparecerá onde você pode verificar o progresso do treinamento, o status do trabalho e outros detalhes para este trabalho.
O treinamento pode levar algum tempo, dependendo do tamanho dos dados de treinamento e da complexidade do esquema. Você pode usar a solicitação a seguir para continuar pesquisando o status do trabalho de treinamento até que ele seja concluído com êxito.
Use a seguinte solicitação GET para obter o status do progresso do treinamento do seu modelo. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas.
EmailApp
{JOB-ID}
O ID para localizar o status de treinamento do seu modelo. Isso está no valor do location cabeçalho que você recebeu quando enviou seu trabalho de treinamento.
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Organismo de resposta
Depois de enviar o pedido, obterá a seguinte resposta. Continue pesquisando este ponto de extremidade até que o parâmetro de status mude para "bem-sucedido".
Para cancelar um trabalho de formação a partir do Language Studio, aceda à página Modelo de comboio. Selecione o trabalho de treinamento que deseja cancelar e selecione Cancelar no menu superior.
Crie uma solicitação POST usando a seguinte URL, cabeçalhos e corpo JSON para cancelar um trabalho de treinamento.
URL do Pedido
Use a seguinte URL ao criar sua solicitação de API. Substitua os valores de espaço reservado abaixo pelos seus próprios valores.
Use o cabeçalho a seguir para autenticar sua solicitação.
Key
valor
Ocp-Apim-Subscription-Key
A chave para o seu recurso. Usado para autenticar suas solicitações de API.
Depois de enviar sua solicitação de API, você receberá uma resposta 202 indicando sucesso, o que significa que seu trabalho de treinamento foi cancelado. Uma chamada bem-sucedida resulta com um cabeçalho Operation-Location usado para verificar o status do trabalho.