Compartilhar via


Definições e termos do reconhecimento de entidade nomeada personalizada

Use este artigo para saber mais sobre algumas das definições e termos que você pode encontrar ao usar o NER personalizada.

Entidade

Uma entidade é um intervalo de texto que indica um determinado tipo de informação. O intervalo de texto pode consistir em uma ou mais palavras. No escopo do NER personalizado, as entidades representam as informações que o usuário deseja extrair do texto. Os desenvolvedores marcam entidades dentro de seus dados com as entidades necessárias antes de passá-las para o modelo de treinamento. Por exemplo, "Número da fatura", "Data de início", "Número da remessa", "Local de nascimento", "Cidade de origem", "Nome do fornecedor" ou "Endereço do cliente".

Por exemplo, na frase "John emprestou US$25.000 de Fred.", as entidades podem ser:

Nome/tipo da entidade Entidade
Nome do tomador do empréstimo John
Nome do credor Fred
Valor do empréstimo US$25.000

Medida f

A medida f é uma função de Precisão e Recall. Ela é necessária quando você busca um equilíbrio entre precisão e recall.

Modelar

Um modelo é um objeto que foi treinado para realizar uma determinada tarefa, neste caso, o reconhecimento de entidade personalizada. Para treinar os modelos, forneça a eles dados rotulados para que baseiem o aprendizado e usem posteriormente nas tarefas de reconhecimento.

  • Treinamento de modelo é o processo de ensinar ao modelo o que extrair com base nos dados rotulados.
  • A avaliação do modelo é o processo que acontece logo após o treinamento para saber o desempenho do modelo.
  • Implantação é o processo de atribuir seu modelo a uma implantação para disponibilizá-lo para uso por meio da API de previsão.

Precisão

Mede a precisão/exatidão do modelo. É a taxa entre os positivos identificados corretamente (verdadeiros positivos) e todos os positivos identificados. A métrica de precisão revela quantas das classes previstas estão rotuladas corretamente.

Project

Um projeto é uma área de trabalho para a criação de modelos de ML personalizados com base em seus dados. Seu projeto só pode ser acessado por você e por outras pessoas que têm acesso ao recurso do Azure que está sendo usado. Como um pré-requisito para criar um projeto de extração de entidade personalizado, você precisa conectar seu recurso a uma conta de armazenamento com seu conjunto de dados ao criar um projeto. Seu projeto inclui automaticamente todos os arquivos .txt disponíveis no seu contêiner.

No seu projeto, você pode realizar as seguintes ações:

  • Rotular seus dados: o processo que rotula os dados para que, ao treinar seu modelo, ele aprenda o que você deseja extrair.
  • Criar e treinar seu modelo: a etapa principal do projeto, na qual o modelo começa a aprender com os dados rotulados.
  • Exibir detalhes de avaliação do modelo: examine o desempenho do modelo para decidir se há espaço para melhoria ou se você está satisfeito com os resultados.
  • Implantação: depois de examinar o desempenho do modelo e decidir que ele pode ser usado em seu ambiente, você precisa atribuí-lo a uma implantação para usá-lo. Atribuir o modelo a uma implantação disponibiliza-o para uso por meio da API de previsão.
  • Modelo de teste: depois de implantar o modelo, teste sua implantação no Language Studio para ver o desempenho dele na produção.

Chamar de volta

Mede a capacidade do modelo de prever classes positivas reais. É a taxa entre os verdadeiros positivos previstos e o que foi realmente marcado. A métrica de recall revelam quantas das classes previstas estão corretas.

Próximas etapas