Início Rápido – Reconhecimento de Entidade Nomeada personalizada
Use este artigo para começar a criar um projeto NER, no qual você pode treinar modelos personalizados para a entidade personalizada. Um modelo é um software de inteligência artificial treinado para fazer um determinada tarefa. Para esse sistema, os modelos extraem entidades nomeadas e são treinados ao aprender com dados marcados.
Neste artigo, usamos o Language Studio para demonstrar os principais conceitos de NER (Reconhecimento de Entidade Nomeada) personalizado. Como exemplo, compilaremos um modelo de NER personalizado para extrair entidades relevantes de contratos de empréstimo, como:
- Data do contrato
- Nome, endereço, cidade e estado do mutuário
- Nome, endereço, cidade e estado do credor
- Valores de empréstimos e juros
Pré-requisitos
- Assinatura do Azure – Criar uma gratuitamente
Criar um novo recurso de Linguagem da IA do Azure e uma conta de Armazenamento do Azure
Antes de usar o NER personalizado, você precisará criar um recurso de Linguagem de IA do Azure que fornecerá as credenciais necessárias para criar um projeto e começar a treinar um modelo. Você também precisará de uma conta de armazenamento do Azure, na qual poderá carregar o conjunto de dados que será usado para compilar o modelo.
Importante
Para começar a usar o recurso rapidamente, recomendamos que você crie um recurso de Linguagem da IA do Azure usando as etapas fornecidas neste artigo. Usar as etapas neste artigo permitirá que você crie o recurso de linguagem e a conta de armazenamento ao mesmo tempo, que é mais fácil do que fazer depois.
Se caso tiver um recurso pré-existente que gostaria de usar, precisará conectá-lo a uma conta de armazenamento. Consulte as diretrizes para usar um recurso preexistente para obter informações.
Criar um recurso usando o portal do Azure
Entre no portal do Azure para criar um novo recurso de Linguagem de IA do Azure.
Na janela que aparece, selecione Classificação de textos personalizada e reconhecimento de entidade nomeada personalizada nos recursos personalizados. Selecione Continuar para criar seu recurso na parte inferior da tela.
Crie um recurso de Linguagem com os seguintes detalhes.
Nome Descrição Subscription Sua assinatura do Azure. Resource group O grupo de recursos que conterá seu recurso. É possível usar um grupo existente ou criar um do zero. Região A região para seu recurso de linguagem. Por exemplo, “Oeste dos EUA 2”. Nome Um nome para seu recurso. Tipo de preço O tipo de preço do recurso de Linguagem. Use a camada Gratuita (F0) para experimentar o serviço. Observação
Se você receber uma mensagem dizendo que "sua conta de logon não é uma proprietária do grupo de recursos da conta de armazenamento selecionada", sua conta precisará ter uma função de proprietário atribuída no grupo de recursos antes de criar um recurso de linguagem. Entre em contato com o proprietário da assinatura do Azure para obter ajuda.
Na seção Classificação de textos personalizada e reconhecimento de entidade nomeada personalizada, selecione uma conta de armazenamento existente ou Nova conta de armazenamento. Esses valores são para ajudar você a começar a usar o recurso, e não são necessariamente os valores de conta de armazenamento que você usará nos ambientes de produção. Para evitar latência durante a criação do projeto, conecte-se às contas de armazenamento na mesma região que o recurso de Linguagem.
Valor de conta de armazenamento Valor recomendado Nome da conta de armazenamento Qualquer nome Tipo de conta de armazenamento LRS Padrão Verifique se a opção Aviso de IA Responsável está marcada. Selecione Examinar + criar na parte inferior da página e depois Criar.
Carregar dados de exemplo para o contêiner de blob
Depois de criar uma conta de armazenamento do Azure e conectá-la ao recurso de Linguagem, você precisará carregar os documentos do conjunto de dados de exemplo no diretório raiz do contêiner. Estes documentos serão usados posteriormente para treinar o seu modelo.
Baixar o conjunto de dados de exemplo do GitHub.
Abra o arquivo .zip e extraia a pasta que contém os documentos.
No portal do Azure, navegue até a conta de armazenamento que você criou e selecione-a.
Em sua conta de armazenamento, selecione Contêineres no menu esquerdo localizado abaixo de Armazenamento de dados. Na tela exibida, selecione + Contêiner. Nomeie o contêiner como example-data e deixe o Nível de acesso público padrão.
Após criar o contêiner, selecione-o. Em seguida, selecione o botão Carregar para selecionar os arquivos
.txt
e.json
baixados anteriormente.
O conjunto de dados de amostra fornecido contém 20 contratos de empréstimo. Cada contrato inclui duas partes: um credor e um tomador de empréstimo. Você pode usar o arquivo de exemplo fornecido para extrair informações relevantes para: ambas as partes, uma data do contrato, um valor do empréstimo e uma taxa de juros.
Crie um projeto de reconhecimento de entidade nomeada personalizado
Depois de configurar o recurso e a conta de armazenamento, crie um novo projeto NER personalizado. Um projeto é uma área de trabalho para a criação de modelos de ML personalizados com base em seus dados. Seu projeto só pode ser acessado por você e por outras pessoas que têm acesso ao recurso de idioma sendo usado.
Entre no Language Studio. Uma janela será exibida para permitir que você selecione sua assinatura e o recurso idioma. Selecione o recurso de idioma que você criou na etapa acima.
Na seção Extrair informações do Language Studio, selecione Reconhecimento de entidade nomeada personalizada.
Selecione Criar projeto no menu superior na página de projetos. A criação de um projeto permitirá que você marque dados, treine, avalie, melhore e implante seus modelos.
Depois de clicar em Criar projeto, uma janela será exibida para permitir que você conecte sua conta de armazenamento. Se você já tiver conectado uma conta de armazenamento, verá o armazenamento conectado. Caso contrário, escolha a conta de armazenamento na lista suspensa que aparece e selecione Conectar conta de armazenamento. Isso definirá as funções necessárias para a sua conta de armazenamento. É possível que essa etapa retorne um erro se você não for atribuído como proprietário na conta de armazenamento.
Observação
- Para começar logo, é recomendável criar um novo recurso de Linguagem do Azure por meio das etapas fornecidas abaixo, o que permitirá que você crie o recurso e configure uma conta de armazenamento ao mesmo tempo, o que é mais fácil do que fazê-lo mais tarde.
- Esse processo é irreversível, se você conectar uma conta de armazenamento ao recurso de idioma, não poderá desconectá-la posteriormente.
- É possível conectar o recurso de idioma a apenas uma conta de armazenamento.
Insira as informações do projeto, incluindo um nome, uma descrição e o idioma dos arquivos em seu projeto. Se você estiver usando o conjunto de dados de exemplo, selecione Inglês. Você não poderá alterar o nome do projeto mais tarde. Selecione Avançar
Dica
Seu conjunto de dados não precisa estar totalmente no mesmo idioma. Você pode ter vários documentos, cada um com diferentes idiomas compatíveis. Se o conjunto de dados contiver documentos de idiomas diferentes ou se você esperar um texto de diferentes idiomas durante o runtime, selecione Habilitar conjunto de dados multilíngue ao inserir as informações básicas no projeto. Essa opção pode ser habilitada posteriormente na página Configurações do projeto.
Selecione o contêiner em que você carregou o conjunto de dados. Se você já rotulou os dados, certifique-se de que seguem o formato com suporte e selecione Sim, meus arquivos já estão rotulados e formatei o arquivo de rótulos JSON e selecione o arquivo de rótulos no menu suspenso. Selecione Avançar.
Revise os dados inseridos e selecione Criar Projeto.
Treinar seu modelo
Normalmente, depois de criar um projeto, você começa a marcar os documentos presentes no contêiner conectado ao projeto. Para este início rápido, você importou um conjunto de dados marcado de exemplo e inicializou o projeto com o arquivo de marcas JSON de exemplo.
Para começar a treinar o modelo no Language Studio:
Selecione Trabalhos de treinamento no menu à esquerda.
Selecione Iniciar um trabalho de treinamento no menu superior.
Selecione Treinar um novo modelo e digite o nome do modelo na caixa de texto. Também é possível substituir um modelo existente selecionando essa opção e escolhendo o modelo que você deseja substituir no menu suspenso. A substituição de um modelo treinado é irreversível, mas não afetará os modelos implantados até que você implante o novo modelo.
Selecione o método de divisão de dados. Você pode optar por dividir automaticamente o conjunto de teste nos dados de treinamento, em que o sistema dividirá os dados rotulados entre os conjuntos de treinamento e de teste, de acordo com os percentuais especificados. Alternativamente, você pode Usar uma divisão manual dos dados de treinamento e de teste. Essa opção será habilitada somente se você tiver adicionado documentos ao conjunto de teste durante a rotulagem de dados. Confira Como treinar um modelo para obter mais informações sobre divisão de dados.
Selecione o botão Treinar.
Se você selecionar a ID de Trabalho de Treinamento da lista, será exibido um painel lateral no qual você poderá verificar o Progresso do treinamento, o Status do trabalho e outros detalhes para esse trabalho.
Observação
- Somente os trabalhos de treinamento concluídos com êxito vão gerar modelos.
- O treinamento pode levar entre alguns minutos e várias horas de acordo com o tamanho dos dados rotulados.
- É possível ter um trabalho de treinamento em execução por vez. Não é possível iniciar outro trabalho de treinamento no mesmo projeto até que o trabalho em execução seja concluído.
Implantar o seu modelo
Geralmente, depois de treinar um modelo, você pode revisar os detalhes da avaliação e fazer aprimoramentos, se necessário. Neste início rápido, você implantará somente o modelo e o disponibilizará para ser experimentado no estúdio de Linguagem ou você poderá chamar a API de previsão.
Para implantar o modelo por meio do Language Studio:
Selecione Implantar um modelo no menu à esquerda.
Selecione Adicionar implantação para iniciar um novo trabalho de implantação.
Selecione Criar implantação para criar uma implantação e atribuir um modelo treinado na lista suspensa abaixo. Você também pode Substituir uma implantação existente selecionando essa opção e escolhendo o modelo treinado que deseja atribuir na lista suspensa abaixo.
Observação
A substituição de uma implantação existente não exige alterações na chamada à API de previsão, mas os resultados obtidos serão baseados no modelo recém-atribuído.
Selecione Implantar para iniciar a implantação.
Depois que a implantação for realizada com sucesso, uma data de validade será exibida. A expiração da implantação consiste no momento em que o modelo implantado não estará disponível para ser usado para previsão, o que normalmente acontece 12 meses após a expiração de uma configuração de treinamento.
Testar o modelo
Depois que o modelo for implantado, você poderá começar a usá-lo para extrair entidades do texto por meio da API de Previsão. Para este início rápido, você usará o Language Studio para enviar a tarefa de reconhecimento de entidade personalizada e visualizar os resultados. No conjunto de dados de exemplo que você baixou anteriormente, poderá encontrar alguns documentos de teste que podem ser usados nesta etapa.
Para testar os modelos implantados de dentro do Language Studio:
Selecione Testar implantações no menu à esquerda.
Selecione a implantação que deseja testar. Você só pode testar modelos atribuídos a implantações.
Para projetos multilíngues, na lista suspensa de idiomas, selecione o idioma do texto que você está testando.
Selecione a implantação que deseja consultar/testar na lista suspensa.
É possível inserir o texto que deseja enviar à solicitação ou carregar um arquivo
.txt
a ser usado.Selecione Executar o teste no menu superior.
Na guia Resultado, você pode ver as entidades extraídas de seu texto e seus tipos. Você também pode exibir a resposta JSON na guia JSON.
Limpar os recursos
Quando não precisar mais do seu projeto, poderá excluí-lo do projeto usando o Language Studio. Selecione NER (reconhecimento de entidade nomeada personalizada) na parte superior, selecione o projeto que deseja excluir e selecione Excluir no menu superior.
Pré-requisitos
- Assinatura do Azure – Criar uma gratuitamente
Criar um novo recurso de Linguagem da IA do Azure e uma conta de Armazenamento do Azure
Antes de usar o NER personalizado, você precisará criar um recurso de Linguagem de IA do Azure que fornecerá as credenciais necessárias para criar um projeto e começar a treinar um modelo. Você também precisará de uma conta de armazenamento do Azure, na qual poderá carregar o conjunto de dados que será usado na criação do modelo.
Importante
Para começar a usar o recurso rapidamente, recomendamos que você crie um recurso de Linguagem da IA do Azure usando as etapas fornecidas neste artigo, o que permitirá que você crie o recurso de Linguagem e crie e/ou configure uma conta de armazenamento ao mesmo tempo, o que é mais fácil do que fazê-lo mais tarde.
Se caso tiver um recurso pré-existente que gostaria de usar, precisará conectá-lo a uma conta de armazenamento. Confira criar projeto para obter mais informações.
Criar um recurso usando o portal do Azure
Entre no portal do Azure para criar um novo recurso de Linguagem de IA do Azure.
Na janela que aparece, selecione Classificação de textos personalizada e reconhecimento de entidade nomeada personalizada nos recursos personalizados. Selecione Continuar para criar seu recurso na parte inferior da tela.
Crie um recurso de Linguagem com os seguintes detalhes.
Nome Descrição Subscription Sua assinatura do Azure. Resource group O grupo de recursos que conterá seu recurso. É possível usar um grupo existente ou criar um do zero. Região A região para seu recurso de linguagem. Por exemplo, “Oeste dos EUA 2”. Nome Um nome para seu recurso. Tipo de preço O tipo de preço do recurso de Linguagem. Use a camada Gratuita (F0) para experimentar o serviço. Observação
Se você receber uma mensagem dizendo que "sua conta de logon não é uma proprietária do grupo de recursos da conta de armazenamento selecionada", sua conta precisará ter uma função de proprietário atribuída no grupo de recursos antes de criar um recurso de linguagem. Entre em contato com o proprietário da assinatura do Azure para obter ajuda.
Na seção Classificação de textos personalizada e reconhecimento de entidade nomeada personalizada, selecione uma conta de armazenamento existente ou Nova conta de armazenamento. Esses valores são para ajudar você a começar a usar o recurso, e não são necessariamente os valores de conta de armazenamento que você usará nos ambientes de produção. Para evitar latência durante a criação do projeto, conecte-se às contas de armazenamento na mesma região que o recurso de Linguagem.
Valor de conta de armazenamento Valor recomendado Nome da conta de armazenamento Qualquer nome Tipo de conta de armazenamento LRS Padrão Verifique se a opção Aviso de IA Responsável está marcada. Selecione Examinar + criar na parte inferior da página e depois Criar.
Carregar dados de exemplo para o contêiner de blob
Depois de criar uma conta de armazenamento do Azure e conectá-la ao recurso de Linguagem, você precisará carregar os documentos do conjunto de dados de exemplo no diretório raiz do contêiner. Estes documentos serão usados posteriormente para treinar o seu modelo.
Baixar o conjunto de dados de exemplo do GitHub.
Abra o arquivo .zip e extraia a pasta que contém os documentos.
No portal do Azure, navegue até a conta de armazenamento que você criou e selecione-a.
Em sua conta de armazenamento, selecione Contêineres no menu esquerdo localizado abaixo de Armazenamento de dados. Na tela exibida, selecione + Contêiner. Nomeie o contêiner como example-data e deixe o Nível de acesso público padrão.
Após criar o contêiner, selecione-o. Em seguida, selecione o botão Carregar para selecionar os arquivos
.txt
e.json
baixados anteriormente.
O conjunto de dados de amostra fornecido contém 20 contratos de empréstimo. Cada contrato inclui duas partes: um credor e um tomador de empréstimo. Você pode usar o arquivo de exemplo fornecido para extrair informações relevantes para: ambas as partes, uma data do contrato, um valor do empréstimo e uma taxa de juros.
Obter suas chaves de recurso e ponto de extremidade
No portal do Azure, vá para a página de visão geral do recurso
No menu do lado esquerdo, selecione Chaves e Ponto de Extremidade. Você usará o ponto de extremidade e a chave para as solicitações de API
Criar um projeto NER personalizado
Depois de configurar o recurso e a conta de armazenamento, crie um novo projeto NER personalizado. Um projeto é uma área de trabalho para a criação de modelos de ML personalizados com base em seus dados. Seu projeto só pode ser acessado por você e por outras pessoas que têm acesso ao recurso de idioma sendo usado.
Use o arquivo de marcas baixado dos dados de exemplo na etapa anterior e adicione-o ao corpo da solicitação a seguir.
Disparar trabalho de projeto de importação
Envie uma solicitaçãoPOST usando o URL, os cabeçalhos e o corpo JSON a seguir para importar o arquivo de rótulos. Verifique se o arquivo de rótulos segue o formato de arquivo aceito.
Se já existir um projeto com o mesmo nome, os dados desse projeto serão substituídos.
{Endpoint}/language/authoring/analyze-text/projects/{projectName}/:import?api-version={API-VERSION}
Espaço reservado | Valor | Exemplo |
---|---|---|
{ENDPOINT} |
O ponto de extremidade para autenticação de sua solicitação de API. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{PROJECT-NAME} |
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas. | myProject |
{API-VERSION} |
A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis. | 2022-05-01 |
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Chave | Valor |
---|---|
Ocp-Apim-Subscription-Key |
A chave para o recurso. Usado para autenticação de suas solicitações de API. |
Corpo
Use o JSON a seguir em sua solicitação. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.
{
"projectFileVersion": "{API-VERSION}",
"stringIndexType": "Utf16CodeUnit",
"metadata": {
"projectName": "{PROJECT-NAME}",
"projectKind": "CustomEntityRecognition",
"description": "Trying out custom NER",
"language": "{LANGUAGE-CODE}",
"multilingual": true,
"storageInputContainerName": "{CONTAINER-NAME}",
"settings": {}
},
"assets": {
"projectKind": "CustomEntityRecognition",
"entities": [
{
"category": "Entity1"
},
{
"category": "Entity2"
}
],
"documents": [
{
"location": "{DOCUMENT-NAME}",
"language": "{LANGUAGE-CODE}",
"dataset": "{DATASET}",
"entities": [
{
"regionOffset": 0,
"regionLength": 500,
"labels": [
{
"category": "Entity1",
"offset": 25,
"length": 10
},
{
"category": "Entity2",
"offset": 120,
"length": 8
}
]
}
]
},
{
"location": "{DOCUMENT-NAME}",
"language": "{LANGUAGE-CODE}",
"dataset": "{DATASET}",
"entities": [
{
"regionOffset": 0,
"regionLength": 100,
"labels": [
{
"category": "Entity2",
"offset": 20,
"length": 5
}
]
}
]
}
]
}
}
Chave | Espaço reservado | Valor | Exemplo |
---|---|---|---|
api-version |
{API-VERSION} |
A versão da API que você está chamando. A versão usada aqui precisa ser a mesma versão da API na URL. Saiba mais sobre as outras versões de API disponíveis | 2022-03-01-preview |
projectName |
{PROJECT-NAME} |
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas. | myProject |
projectKind |
CustomEntityRecognition |
O tipo de projeto. | CustomEntityRecognition |
language |
{LANGUAGE-CODE} |
Uma cadeia de caracteres que especifica o código de linguagem para os documentos usados no projeto. Se for um projeto multilíngue, escolha o código de linguagem da maioria dos documentos. | en-us |
multilingual |
true |
Um valor booliano que permite ter documentos em várias linguagens no conjunto de dados e, quando o modelo é implantado, é possível consultar o modelo em qualquer linguagem com suporte, não necessariamente incluída nos documentos de treinamento. Confira suporte de idioma para obter informações sobre suporte multilíngue. | true |
storageInputContainerName |
{CONTAINER-NAME} | O nome do contêiner de armazenamento do Azure em que você carregou os documentos. | myContainer |
entities |
Matriz que contém todos os tipos de entidade presentes no projeto. São os tipos de entidade que serão extraídos dos documentos. | ||
documents |
Matriz que contém todos os documentos no projeto e lista das entidades rotuladas em cada documento. | [] | |
location |
{DOCUMENT-NAME} |
O local dos documentos no contêiner de armazenamento. Como todos os documentos estão na raiz do contêiner, esse deve ser o nome do documento. | doc1.txt |
dataset |
{DATASET} |
O conjunto de teste para o qual esse arquivo será exibido, quando dividido antes do treinamento. Confira Como treinar um modelo para obter mais informações sobre como os dados são divididos. Os valores possíveis para esse campo são Train e Test . |
Train |
Depois de enviar a solicitação à API, você receberá uma resposta 202
indicando que o trabalho foi enviado corretamente. Nos cabeçalhos de resposta, extraia o valor operation-location
. A formatação ficará da seguinte maneira:
{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/import/jobs/{JOB-ID}?api-version={API-VERSION}
{JOB-ID}
é usado para identificar sua solicitação, pois essa operação é assíncrona. Você usará essa URL para obter o status do trabalho de importação.
Possíveis cenários de erro para esta solicitação:
- O recurso selecionado não tem as permissões apropriadas para a conta de armazenamento.
- O
storageInputContainerName
especificado não existe. - Um código de idioma inválido foi usado ou o tipo de código de idioma não é cadeia de caracteres.
- O valor
multilingual
é uma cadeia de caracteres e não um booliano.
Obter o status do trabalho de importação
Use a solicitação GET a seguir para obter o status da importação do projeto. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.
URL da solicitação
{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/import/jobs/{JOB-ID}?api-version={API-VERSION}
Espaço reservado | Valor | Exemplo |
---|---|---|
{ENDPOINT} |
O ponto de extremidade para autenticação de sua solicitação de API. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{PROJECT-NAME} |
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas. | myProject |
{JOB-ID} |
A ID para localização do status de treinamento do modelo. Esse valor está no valor de cabeçalho location que você obteve na etapa anterior. |
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx |
{API-VERSION} |
A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis. | 2022-05-01 |
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Chave | Valor |
---|---|
Ocp-Apim-Subscription-Key |
A chave para o recurso. Usado para autenticação de suas solicitações de API. |
Treinar seu modelo
Normalmente, depois de criar um projeto, você começa a marcar os documentos presentes no contêiner conectado ao projeto. Para este início rápido, você importou um conjunto de dados marcado de exemplo e inicializou o projeto com o arquivo de marcas JSON de exemplo.
Iniciar o trabalho de treinamento
Depois que o projeto tiver sido importado, você poderá começar a treinar o modelo.
Envie uma solicitação POST usando a URL, os cabeçalhos e o corpo JSON a seguir para enviar um trabalho de treinamento. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.
{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/:train?api-version={API-VERSION}
Espaço reservado | Valor | Exemplo |
---|---|---|
{ENDPOINT} |
O ponto de extremidade para autenticação de sua solicitação de API. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{PROJECT-NAME} |
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas. | myProject |
{API-VERSION} |
A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis. | 2022-05-01 |
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Chave | Valor |
---|---|
Ocp-Apim-Subscription-Key |
A chave para o recurso. Usado para autenticação de suas solicitações de API. |
Corpo da solicitação
Use o JSON a seguir no corpo da solicitação. O modelo receberá o {MODEL-NAME}
quando o treinamento for concluído. Somente os trabalhos de treinamento executados com êxito produzirão modelos.
{
"modelLabel": "{MODEL-NAME}",
"trainingConfigVersion": "{CONFIG-VERSION}",
"evaluationOptions": {
"kind": "percentage",
"trainingSplitPercentage": 80,
"testingSplitPercentage": 20
}
}
Chave | Espaço reservado | Valor | Exemplo |
---|---|---|---|
modelLabel | {MODEL-NAME} |
O nome que será atribuído ao modelo uma vez que ele seja treinado com êxito. | myModel |
trainingConfigVersion | {CONFIG-VERSION} |
Esta é a versão do modelo que será usada para treinar o modelo. | 2022-05-01 |
evaluationOptions | Opção para dividir os dados entre conjuntos de treinamento e de teste. | {} |
|
kind | percentage |
Métodos de divisão. Os possíveis valores são percentage ou manual . Confira Como treinar um modelo para obter mais informações. |
percentage |
trainingSplitPercentage | 80 |
Porcentual dos dados marcados a serem incluídos no conjunto de treinamentos. O valor recomendado é 80 . |
80 |
testingSplitPercentage | 20 |
Porcentual dos dados marcados a serem incluídos no conjunto de teste. O valor recomendado é 20 . |
20 |
Observação
trainingSplitPercentage
e testingSplitPercentage
serão necessários somente se Kind
for definido como percentage
, sendo que a soma de ambos os percentuais deverá ser igual a 100.
Depois de enviar a solicitação à API, você receberá uma resposta 202
indicando que o trabalho foi enviado corretamente. Nos cabeçalhos de resposta, extraia o valor location
. A formatação ficará da seguinte maneira:
{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}
{JOB-ID}
é usado para identificar sua solicitação, pois essa operação é assíncrona. Você pode usar essa URL para obter o status de treinamento.
Obter status do trabalho de treinamento
O treinamento pode levar entre 10 e 30 minutos para este conjunto de dados de exemplo. Você pode usar a solicitação a seguir para continuar sondando o status do trabalho de treinamento até que ele seja concluído com êxito.
Use a seguinte solicitação GET para obter o status do processo de treinamento do modelo. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.
URL da solicitação
{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/train/jobs/{JOB-ID}?api-version={API-VERSION}
Espaço reservado | Valor | Exemplo |
---|---|---|
{ENDPOINT} |
O ponto de extremidade para autenticação de sua solicitação de API. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{PROJECT-NAME} |
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas. | myProject |
{JOB-ID} |
A ID para localização do status de treinamento do modelo. Esse valor está no valor de cabeçalho location que você obteve na etapa anterior. |
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx |
{API-VERSION} |
A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis. | 2022-05-01 |
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Chave | Valor |
---|---|
Ocp-Apim-Subscription-Key |
A chave para o recurso. Usado para autenticação de suas solicitações de API. |
Corpo da resposta
Após enviar a solicitação, você receberá a seguinte resposta.
{
"result": {
"modelLabel": "{MODEL-NAME}",
"trainingConfigVersion": "{CONFIG-VERSION}",
"estimatedEndDateTime": "2022-04-18T15:47:58.8190649Z",
"trainingStatus": {
"percentComplete": 3,
"startDateTime": "2022-04-18T15:45:06.8190649Z",
"status": "running"
},
"evaluationStatus": {
"percentComplete": 0,
"status": "notStarted"
}
},
"jobId": "{JOB-ID}",
"createdDateTime": "2022-04-18T15:44:44Z",
"lastUpdatedDateTime": "2022-04-18T15:45:48Z",
"expirationDateTime": "2022-04-25T15:44:44Z",
"status": "running"
}
Implantar o seu modelo
Geralmente, depois de treinar um modelo, você pode revisar os detalhes da avaliação e fazer melhorias, se necessário. Neste início rápido, você apenas implantará o modelo e o disponibilizará para ser experimentado no Language Studio ou você poderá chamar a API de previsão.
Iniciar trabalho de implantação
Envie uma solicitaçãoPUT usando a URL, os cabeçalhos e o corpo JSON a seguir para enviar o trabalho de implantação. Substitua os valores dos espaços reservados abaixo pelos seus próprios valores.
{Endpoint}/language/authoring/analyze-text/projects/{projectName}/deployments/{deploymentName}?api-version={API-VERSION}
Espaço reservado | Valor | Exemplo |
---|---|---|
{ENDPOINT} |
O ponto de extremidade para autenticação de sua solicitação de API. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{PROJECT-NAME} |
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas. | myProject |
{DEPLOYMENT-NAME} |
O nome da sua implantação. Esse valor diferencia maiúsculas de minúsculas. | staging |
{API-VERSION} |
A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis. | 2022-05-01 |
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Chave | Valor |
---|---|
Ocp-Apim-Subscription-Key |
A chave para o recurso. Usado para autenticação de suas solicitações de API. |
Corpo da solicitação
Use o JSON a seguir no corpo da solicitação. Use o nome do modelo atribuído à implantação.
{
"trainedModelLabel": "{MODEL-NAME}"
}
Chave | Espaço reservado | Valor | Exemplo |
---|---|---|---|
trainedModelLabel | {MODEL-NAME} |
O nome do modelo que será atribuído à implantação. Você só pode atribuir modelos treinados com sucesso. Esse valor diferencia maiúsculas de minúsculas. | myModel |
Depois de enviar a solicitação à API, você receberá uma resposta 202
indicando que o trabalho foi enviado corretamente. Nos cabeçalhos de resposta, extraia o valor operation-location
. A formatação ficará da seguinte maneira:
{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/deployments/{DEPLOYMENT-NAME}/jobs/{JOB-ID}?api-version={API-VERSION}
{JOB-ID}
é usado para identificar sua solicitação, pois essa operação é assíncrona. Você pode usar essa URL para obter o status de implantação.
Obter status do trabalho de implantação
Use a solicitação GET a seguir para consultar o status do trabalho de implantação. Você pode usar a URL que obteve na etapa anterior ou substituir os valores de espaço reservado abaixo pelos seus próprios valores.
{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/deployments/{DEPLOYMENT-NAME}/jobs/{JOB-ID}?api-version={API-VERSION}
Espaço reservado | Valor | Exemplo |
---|---|---|
{ENDPOINT} |
O ponto de extremidade para autenticação de sua solicitação de API. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{PROJECT-NAME} |
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas. | myProject |
{DEPLOYMENT-NAME} |
O nome da sua implantação. Esse valor diferencia maiúsculas de minúsculas. | staging |
{JOB-ID} |
A ID para localização do status de treinamento do modelo. Isso está no valor de cabeçalho location que você obteve na etapa anterior. |
xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxxx |
{API-VERSION} |
A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis. | 2022-05-01 |
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Chave | Valor |
---|---|
Ocp-Apim-Subscription-Key |
A chave para o recurso. Usado para autenticação de suas solicitações de API. |
Corpo da resposta
Depois de enviar a solicitação, você receberá a seguinte resposta. Continue sondando esse ponto de extremidade até que o parâmetro de status mude para "bem-sucedido". Você deve obter um código 200
para indicar o sucesso da solicitação.
{
"jobId":"{JOB-ID}",
"createdDateTime":"{CREATED-TIME}",
"lastUpdatedDateTime":"{UPDATED-TIME}",
"expirationDateTime":"{EXPIRATION-TIME}",
"status":"running"
}
Extrair entidades personalizadas
Depois que o modelo for implantado, você poderá começar a usá-lo para extrair entidades do texto usando a API de Previsão. No conjunto de dados de exemplo que você baixou anteriormente, poderá encontrar alguns documentos de teste que podem ser usados nesta etapa.
Enviar a tarefa do NER personalizada
Use esta solicitação POST para iniciar uma tarefa de classificação de textos.
{ENDPOINT}/language/analyze-text/jobs?api-version={API-VERSION}
Espaço reservado | Valor | Exemplo |
---|---|---|
{ENDPOINT} |
O ponto de extremidade para autenticação de sua solicitação de API. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{API-VERSION} |
A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis. | 2022-05-01 |
Cabeçalhos
Chave | Valor |
---|---|
Ocp-Apim-Subscription-Key | Sua chave que fornece acesso a essa API. |
Corpo
{
"displayName": "Extracting entities",
"analysisInput": {
"documents": [
{
"id": "1",
"language": "{LANGUAGE-CODE}",
"text": "Text1"
},
{
"id": "2",
"language": "{LANGUAGE-CODE}",
"text": "Text2"
}
]
},
"tasks": [
{
"kind": "CustomEntityRecognition",
"taskName": "Entity Recognition",
"parameters": {
"projectName": "{PROJECT-NAME}",
"deploymentName": "{DEPLOYMENT-NAME}"
}
}
]
}
Chave | Espaço reservado | Valor | Exemplo |
---|---|---|---|
displayName |
{JOB-NAME} |
O nome do seu trabalho. | MyJobName |
documents |
[{},{}] | Lista de documentos nos quais executar tarefas. | [{},{}] |
id |
{DOC-ID} |
Nome ou ID do documento. | doc1 |
language |
{LANGUAGE-CODE} |
Uma cadeia de caracteres que especifica o código de idioma do documento. Caso essa chave não seja especificada, o serviço assume o idioma padrão do projeto que foi selecionado durante a criação do projeto. Confira Suporte ao idioma para obter uma lista de todos os códigos de idioma com suporte. | en-us |
text |
{DOC-TEXT} |
Tarefa do documento para executar as tarefas. | Lorem ipsum dolor sit amet |
tasks |
Lista de tarefas que queremos executar. | [] |
|
taskName |
CustomEntityRecognition |
O nome da tarefa | CustomEntityRecognition |
parameters |
Lista de parâmetros a serem passados para a tarefa. | ||
project-name |
{PROJECT-NAME} |
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas. | myProject |
deployment-name |
{DEPLOYMENT-NAME} |
O nome da sua implantação. Esse valor diferencia maiúsculas de minúsculas. | prod |
Resposta
Você receberá uma resposta 202 indicando que sua tarefa foi enviada com êxito. Nos cabeçalhos da resposta, extraia operation-location
.
operation-location
é formatado da seguinte maneira:
{ENDPOINT}/language/analyze-text/jobs/{JOB-ID}?api-version={API-VERSION}
Você pode usar essa URL para consultar o status de conclusão da tarefa e obter os resultados quando a tarefa for concluída.
Obter resultados da tarefa
Use a solicitação GET a seguir para consultar status/resultados da tarefa de reconhecimento de entidade personalizada.
{ENDPOINT}/language/analyze-text/jobs/{JOB-ID}?api-version={API-VERSION}
Espaço reservado | Valor | Exemplo |
---|---|---|
{ENDPOINT} |
O ponto de extremidade para autenticação de sua solicitação de API. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{API-VERSION} |
A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis. | 2022-05-01 |
Cabeçalhos
Chave | Valor |
---|---|
Ocp-Apim-Subscription-Key | Sua chave que fornece acesso a essa API. |
Corpo da resposta
A resposta será um documento JSON com os seguintes parâmetros
{
"createdDateTime": "2021-05-19T14:32:25.578Z",
"displayName": "MyJobName",
"expirationDateTime": "2021-05-19T14:32:25.578Z",
"jobId": "xxxx-xxxx-xxxxx-xxxxx",
"lastUpdateDateTime": "2021-05-19T14:32:25.578Z",
"status": "succeeded",
"tasks": {
"completed": 1,
"failed": 0,
"inProgress": 0,
"total": 1,
"items": [
{
"kind": "EntityRecognitionLROResults",
"taskName": "Recognize Entities",
"lastUpdateDateTime": "2020-10-01T15:01:03Z",
"status": "succeeded",
"results": {
"documents": [
{
"entities": [
{
"category": "Event",
"confidenceScore": 0.61,
"length": 4,
"offset": 18,
"text": "trip"
},
{
"category": "Location",
"confidenceScore": 0.82,
"length": 7,
"offset": 26,
"subcategory": "GPE",
"text": "Seattle"
},
{
"category": "DateTime",
"confidenceScore": 0.8,
"length": 9,
"offset": 34,
"subcategory": "DateRange",
"text": "last week"
}
],
"id": "1",
"warnings": []
}
],
"errors": [],
"modelVersion": "2020-04-01"
}
}
]
}
}
Limpar os recursos
Quando você não precisar mais do seu projeto, poderá excluí-lo com a seguinte solicitação de DELETE. Substitua os valores do espaço reservado pelos seus.
{Endpoint}/language/authoring/analyze-text/projects/{projectName}?api-version={API-VERSION}
Espaço reservado | Valor | Exemplo |
---|---|---|
{ENDPOINT} |
O ponto de extremidade para autenticação de sua solicitação de API. | https://<your-custom-subdomain>.cognitiveservices.azure.com |
{PROJECT-NAME} |
O nome do seu projeto. Esse valor diferencia maiúsculas de minúsculas. | myProject |
{API-VERSION} |
A versão da API que você está chamando. O valor referenciado aqui é para a versão mais recente lançada. Consulte o Ciclo de vida do modelo para saber mais sobre outras versões de API disponíveis. | 2022-05-01 |
Cabeçalhos
Use o cabeçalho a seguir para autenticar sua solicitação.
Chave | Valor |
---|---|
Ocp-Apim-Subscription-Key | A chave para o recurso. Usado para autenticação de suas solicitações de API. |
Depois de enviar a solicitação da API, você receberá uma resposta 202
indicando êxito, o que significa que o projeto foi excluído. Uma chamada bem-sucedida resulta em um cabeçalho Operation-Location usado para verificar o status do trabalho.
Próximas etapas
Depois de criar o modelo de extração de entidade, você pode:
Ao começar a criar seus próprios projetos de NER personalizados, use os artigos de instruções para saber mais sobre como marcar, treinar e consumir seu modelo com mais detalhes: