Partilhar via


Definições e termos personalizados de reconhecimento de entidade nomeada

Use este artigo para saber mais sobre algumas das definições e termos que você pode encontrar ao usar o NER personalizado.

Entidade

Uma entidade é uma extensão de texto que indica um determinado tipo de informação. A extensão do texto pode consistir em uma ou mais palavras. No escopo do NER personalizado, as entidades representam as informações que o usuário deseja extrair do texto. Os desenvolvedores marcam entidades em seus dados com as entidades necessárias antes de passá-las para o modelo para treinamento. Por exemplo, "Número da fatura", "Data de início", "Número da remessa", "Local de nascimento", "Cidade de origem", "Nome do fornecedor" ou "Endereço do cliente".

Por exemplo, na frase "John pegou emprestado 25.000 USD de Fred.", as entidades podem ser:

Nome/tipo de entidade Entidade
Nome do mutuário John
Nome do credor Fábio
Valor do Empréstimo 25.000 USD

Pontuação F1

A pontuação F1 é uma função de Precisão e Recall. É necessário quando se procura um equilíbrio entre precisão e recordação.

Modelo

Um modelo é um objeto que é treinado para executar uma determinada tarefa, neste caso o reconhecimento de entidade personalizada. Os modelos são treinados fornecendo dados rotulados com os quais aprender para que possam ser usados posteriormente para tarefas de reconhecimento.

  • O treinamento de modelo é o processo de ensinar ao seu modelo o que extrair com base em seus dados rotulados.
  • A avaliação do modelo é o processo que acontece logo após o treinamento para saber o desempenho do seu modelo.
  • A implantação é o processo de atribuir seu modelo a uma implantação para disponibilizá-lo para uso por meio da API de previsão.

Precisão

Mede o quão preciso/preciso é o seu modelo. É a relação entre os positivos corretamente identificados (verdadeiros positivos) e todos os positivos identificados. A métrica de precisão revela quantas das classes previstas estão corretamente rotuladas.

Project

Um projeto é uma área de trabalho para criar seus modelos de ML personalizados com base em seus dados. Seu projeto só pode ser acessado por você e outras pessoas que têm acesso ao recurso do Azure que está sendo usado. Como pré-requisito para criar um projeto de extração de entidade personalizado, você precisa conectar seu recurso a uma conta de armazenamento com seu conjunto de dados ao criar um novo projeto. Seu projeto inclui automaticamente todos os .txt arquivos disponíveis em seu contêiner.

Dentro do seu projeto você pode fazer as seguintes ações:

  • Rotule seus dados: o processo de rotular seus dados para que, quando você treinar seu modelo, ele aprenda o que você deseja extrair.
  • Crie e treine seu modelo: a etapa central do seu projeto, onde seu modelo começa a aprender com seus dados rotulados.
  • Exibir detalhes da avaliação do modelo: analise o desempenho do modelo para decidir se há espaço para melhorias ou se você está satisfeito com os resultados.
  • Implantação: depois de analisar o desempenho do modelo e decidir que ele pode ser usado em seu ambiente, você precisa atribuí-lo a uma implantação para usá-lo. A atribuição do modelo a uma implantação o torna disponível para uso por meio da API de previsão.
  • Modelo de teste: depois de implantar seu modelo, teste sua implantação no Language Studio para ver como ele funcionaria na produção.

Recuperar

Mede a capacidade do modelo de prever classes positivas reais. É a relação entre os verdadeiros positivos previstos e o que foi realmente marcado. A métrica de recall revela quantas das classes previstas estão corretas.

Próximos passos