O que é o reconhecimento de entidade nomeado personalizado?

Artigo
10/21/2024

O NER personalizado é um dos recursos personalizados oferecidos pelo Azure AI Language. É um serviço de API baseado em nuvem que aplica inteligência de aprendizado de máquina para permitir que você crie modelos personalizados para tarefas personalizadas de reconhecimento de entidade nomeada.

O NER personalizado permite que os usuários criem modelos de IA personalizados para extrair entidades específicas do domínio de texto não estruturado, como contratos ou documentos financeiros. Ao criar um projeto NER personalizado, os desenvolvedores podem rotular dados iterativamente, treinar, avaliar e melhorar o desempenho do modelo antes de disponibilizá-lo para consumo. A qualidade dos dados rotulados afeta muito o desempenho do modelo. Para simplificar a construção e personalização do seu modelo, o serviço oferece um portal web personalizado que pode ser acessado através do estúdio de idiomas. Você pode facilmente começar com o serviço seguindo as etapas neste início rápido.

Esta documentação contém os seguintes tipos de artigo:

Os guias de início rápido são instruções de introdução para guiá-lo ao fazer solicitações ao serviço.
Os conceitos fornecem explicações sobre a funcionalidade e os recursos do serviço.
Os guias de instruções contêm instruções para usar o serviço de maneiras mais específicas ou personalizadas.

Exemplos de cenários de utilização

O reconhecimento personalizado de entidades nomeadas pode ser usado em vários cenários em uma variedade de setores:

Extração de informação

Muitas organizações financeiras e jurídicas extraem e normalizam dados de milhares de fontes de texto complexas e não estruturadas diariamente. Essas fontes incluem extratos bancários, acordos legais ou formulários bancários. Por exemplo, a extração de dados de aplicativos de hipoteca feita manualmente por revisores humanos pode levar vários dias para ser extraída. Automatizar essas etapas criando um modelo NER personalizado simplifica o processo e economiza custo, tempo e esforço.

Mineração de conhecimento para melhorar/enriquecer a pesquisa semântica

A pesquisa é fundamental para qualquer aplicativo que exponha conteúdo de texto para os usuários. Os cenários comuns incluem pesquisa de catálogos ou documentos, pesquisa de produtos de varejo ou mineração de conhecimento para ciência de dados. Muitas empresas em vários setores querem criar uma experiência de pesquisa rica em conteúdo privado e heterogêneo, que inclui documentos estruturados e não estruturados. Como parte de seu pipeline, os desenvolvedores podem usar o NER personalizado para extrair entidades do texto que são relevantes para seu setor. Essas entidades podem ser usadas para enriquecer a indexação do arquivo para uma experiência de pesquisa mais personalizada.

Auditoria e conformidade

Em vez de revisar manualmente arquivos de texto significativamente longos para auditar e aplicar políticas, os departamentos de TI em empresas financeiras ou jurídicas podem usar o NER personalizado para criar soluções automatizadas. Essas soluções podem ser úteis para aplicar políticas de conformidade e configurar as regras de negócios necessárias com base em pipelines de mineração de conhecimento que processam conteúdo estruturado e não estruturado.

Ciclo de vida de desenvolvimento do projeto

O uso do NER personalizado normalmente envolve várias etapas diferentes.

Defina seu esquema: conheça seus dados e identifique as entidades que deseja extrair. Evite a ambiguidade.
Rotule seus dados: rotular dados é um fator-chave para determinar o desempenho do modelo. Rotule de forma precisa, consistente e completa.
1. Rotule com precisão: rotule cada entidade sempre com o tipo certo. Inclua apenas o que deseja extrair, evite dados desnecessários em seus rótulos.
2. Rotular de forma consistente: a mesma entidade deve ter o mesmo rótulo em todos os arquivos.
3. Rotular completamente: rotule todas as instâncias da entidade em todos os seus arquivos.
Treinar o modelo: seu modelo começa a aprender com seus dados rotulados.
Visualize o desempenho do modelo: Após a conclusão do treinamento, visualize os detalhes da avaliação do modelo, seu desempenho e orientações sobre como melhorá-lo.
Implantar o modelo: a implantação de um modelo o torna disponível para uso por meio da API de análise.
Extrair entidades: use seus modelos personalizados para tarefas de extração de entidades.

Documentação de referência e exemplos de código

À medida que você usa o NER personalizado, consulte a seguinte documentação de referência e exemplos para o Azure AI Language:

Opção de desenvolvimento / linguagem	Documentação de referência	Exemplos
APIs REST (criação)	Documentação da API REST
APIs REST (tempo de execução)	Documentação da API REST
C# (Tempo de execução)	Documentação em C#	Exemplos de C#
Java (Tempo de execução)	Documentação Java	Amostras Java
JavaScript (Tempo de execução)	Documentação do JavaScript	Exemplos de JavaScript
Python (Tempo de execução)	Documentação Python	Amostras de Python

IA responsável

Um sistema de IA inclui não apenas a tecnologia, mas também as pessoas que a usarão, as pessoas que serão afetadas por ela e o ambiente em que ela é implantada. Leia a nota de transparência do NER personalizado para saber mais sobre o uso e a implantação responsáveis de IA em seus sistemas. Você também pode ver os seguintes artigos para obter mais informações:

Próximos passos

Use o artigo de início rápido para começar a usar o reconhecimento personalizado de entidade nomeada.
Ao percorrer o ciclo de vida de desenvolvimento do projeto, revise o glossário para saber mais sobre os termos usados em toda a documentação para esse recurso.
Lembre-se de visualizar os limites de serviço para informações como disponibilidade regional.

Partilhar via