Compartilhar via


Escolha uma tecnologia de processamento de linguagem direcionada de IA do Azure

Os Serviços de IA do Azure ajudam os desenvolvedores e as organizações a criar rapidamente aplicativos inteligentes, de ponta, prontos para o mercado e responsáveis com APIs e modelos prontos para uso, predefinidos e personalizáveis.

Este artigo aborda os Serviços de IA do Azure que oferecem recursos de processamento de linguagem direcionados, como processamento de linguagem natural (NLP), análise de texto, reconhecimento de linguagem, tradução e extração de dados de documentos. A Linguagem de IA do Azure é uma das categorias mais amplas nos Serviços de IA do Azure. Você pode usar as APIs em sua carga de trabalho para incorporar recursos de linguagem, como reconhecimento de entidade nomeada, análise de sentimento, detecção de idioma e sumarização de texto.

Serviços

Os serviços a seguir fornecem recursos de processamento de linguagem direcionados para os serviços de IA do Azure:

  • A Linguagem de IA do Azure fornece processamento de linguagem natural para análise de texto.

    • Use o serviço de Linguagem de IA do Azure quando precisar trabalhar com documentos estruturados ou não estruturados para a ampla variedade de tarefas relacionadas à linguagem descritas.
    • Não use o serviço de Linguagem se você precisar pesquisar documentos com chat, verificar a segurança do conteúdo ou traduzi-los.
  • A Tradutor de IA do Azure é um serviço de tradução automática. Ele pode executar tradução de texto em tempo real, tradução de documentos em lote ou arquivo único e traduções personalizadas que permitem incorporar terminologia especializada ou linguagem específica do setor para o seu cenário. Dá suporte a muitas linguagens.

    • Use o serviço de Tradução quando precisar executar a tradução especificamente. Embora você possa usar outros modelos de linguagem de base de uso geral para realizar a tradução, usar a tradução para sua finalidade especializada pode ser mais confiável e eficaz em termos de custo usando modelos de tradução direcionados.
    • Não use o serviço de Tradução se você precisar interagir com o chat, analisar o conteúdo quanto a sentimentos ou para moderação de conteúdo. Para análise de sentimento, use o serviço de Linguagem. Para moderação de conteúdo, use o serviço de Segurança de Conteúdo.
  • A IA do Azure para Informação de Documentos é um serviço que pode converter imagens diretamente em formulários eletrônicos. Você pode especificar os campos esperados e, em seguida, pesquisar as imagens fornecidas para capturar esses campos sem intervenção humana. O serviço hospeda muitos modelos predefinidos e também permite que você crie seus próprios modelos de formulário personalizados.

    • Use o serviço de Informação de documentos quando souber exatamente quais campos você precisa extrair de documentos digitalizados para preencher formulários eletrônicos adequadamente.
    • Use a Informação de documentos para identificar estruturas-chave (cabeçalhos, rodapés, quebras de capítulo e assim por diante) em diversos corpus de documentos para interagir ainda mais programaticamente com o documento, como em uma implementação de RAG (geração aumentada de recuperação).
    • Não use o serviço Informação de documentos como uma API de pesquisa em tempo real.

Linguagem de IA do Azure

A Linguagem de IA do Azure é um serviço baseado em nuvem que fornece recursos de processamento de linguagem natural (NLP) para compreender e analisar textos. Use esse serviço para ajudar a criar aplicativos inteligentes usando o Language Studio baseado na Web, APIs REST e bibliotecas de clientes.

Funcionalidades

A tabela a seguir fornece uma lista de recursos disponíveis no serviço de Linguagem de IA do Azure.

Capacidade Descrição
Respostas às perguntas personalizadas Cria a resposta mais adequada para as entradas de seus usuários e é comumente usado para criar aplicativos de cliente de conversação, como aplicativos de mídia social, chatbots e aplicativos de área de trabalho habilitados para fala.
Classificação personalizada de textos Crie modelos de IA personalizados para classificar documentos de texto não estruturados em classes personalizadas definidas por você.
Compreensão da linguagem coloquial (CLU) Use para criar modelos personalizados de reconhecimento de linguagem natural para prever a intenção geral de um enunciado recebido e extrair informações importantes dele.
Vinculação de entidade Desambigua a identidade de entidades (palavras ou frases) encontradas em texto não estruturado e retorna links para a Wikipédia.
Detecção de idioma Detecta a linguagem em que um documento está escrito e retorna um código de linguagem para uma ampla gama de linguagens, variantes, dialetos e algumas linguagens regionais/culturais.
Extração de frases-chave Avalia e retorna os conceitos principais em texto não estruturado e os retorna como uma lista.
NER (Reconhecimento de entidade nomeada) Categoriza entidades (palavras ou frases) em texto não estruturado em vários grupos de categorias predefinidos. Por exemplo: pessoas, eventos, locais, datas e muito mais.
Fluxo de Trabalho de Orquestração Use para conectar Compreensão da linguagem coloquial (CLU).
Detecção de PII e PHI (informações de identificação pessoal e de saúde, respectivamente) Identifica, categoriza e edita informações confidenciais em documentos de texto não estruturados e transcrições de conversas. Por exemplo: números de telefone, endereços de email, formas de identificação e muito mais.
Análise de Sentimento e a mineração de opiniões Ajudam a descobrir o que as pessoas pensam da sua marca ou do seu tópico, analisando o texto em busca de pistas sobre sentimentos positivos ou negativos, e podem associá-los a aspectos específicos do texto.
Resumo Usa resumo de texto extrativo para produzir uma sumarização de documentos e transcrições de conversas. Ele extrai frases que representam em conjunto as informações mais importantes ou relevantes do conteúdo original.
Text Analysis for Health Extrai e rotula informações médicas relevantes de textos não estruturados, como anotações médicas, resumos de alta, documentos clínicos e registros eletrônicos de saúde. Ao projetar sua carga de trabalho, avalie o local de processamento e a residência de dados desse recurso hospedado na nuvem para garantir que ele esteja alinhado com suas expectativas de conformidade. Algumas cargas de trabalho podem ser restritas em sua capacidade de enviar dados de saúde para uma plataforma hospedada na nuvem. Você pode usar essa API como um contêiner do Docker para hospedar em sua própria computação na nuvem ou no local, o que pode ajudar a resolver problemas de conformidade envolvendo PaaS. Para saber mais, consulte Usar contêineres do Text Analytics for Health.

Casos de uso

A tabela a seguir fornece uma lista de possíveis casos de uso para o serviço de Linguagem de IA do Azure.

Caso de uso Personalizável*
Preveja a intenção de entradas do usuário e extraia informações deles. Sim
Identificar e/ou redigir informações confidenciais, como PII.
Identifique a linguagem em que um texto foi escrito.
Extraia informações médicas de documentos clínicos ou médicos, sem criar um modelo
Extraia informações médicas de documentos clínicos/médicos usando um modelo treinado em seus dados. Sim
Extraia categorias de informações sem criar um modelo personalizado.
Extraia categorias de informações usando um modelo específico para seus dados. Sim
Extraia tópicos principais e frases importantes.
Resumir um documento
Classificar texto usando análise de sentimento. Sim
Classificar texto usando classes personalizadas. Sim
Classifique os itens em categorias fornecidas no momento da inferência.
Vincular uma entidade a artigos da base de dados de conhecimento.
Entender perguntas e respostas (genérico). Sim
Crie um aplicativo de conversa que responda às entradas do usuário.
Conecte aplicativos de compreensão da linguagem coloquial e respostas às perguntas. Sim

*Se um recurso for personalizável, você poderá treinar um modelo de IA usando nossas ferramentas para ajustar seus dados de maneira específica. Caso contrário, um recurso é pré-configurado, o que significa que os modelos de IA que ele usa não podem ser alterados. Basta enviar seus dados e usar a saída do recurso em seus aplicativos.

Tradutor de IA do Azure

O Tradutor de IA do Azure é um serviço de tradução automática que faz parte da família de Serviços de IA do Azure. O Tradutor capacita muitos produtos e serviços da Microsoft.

Funcionalidades

A tabela a seguir fornece uma lista dos recursos disponíveis no serviço Tradutor de IA do Azure.

Capacidade Descrição
Tradução de texto Execute a conversão de texto entre os idiomas de origem e de destino compatíveis em tempo real. Crie um dicionário dinâmico e saiba como impedir as traduções usando a API de Tradução.
Tradução de Documento Tradução em lote assíncrona: traduza arquivos complexos e de lote, preservando a estrutura e o formato dos documentos originais. O processo de tradução em lote requer uma conta de armazenamento de Blobs do Azure com contêineres para seus documentos originais e traduzidos.
Tradução síncrona de arquivo único: traduza um único arquivo de documento sozinho ou com um arquivo de glossário, preservando a estrutura e o formato do documento original. O processo de tradução de arquivo não requer uma conta de armazenamento de Blobs do Azure. A resposta final contém o documento traduzido e é retornada diretamente ao cliente que está fazendo a chamada.
Tradutor personalizado Crie modelos personalizados para traduzir linguagem, terminologia e estilo específicos de um domínio e de um setor. Criar um dicionário (frase ou sentença) para traduções personalizadas.

Casos de uso

A tabela a seguir fornece uma lista de possíveis casos de uso para o serviço Tradutor de IA do Azure.

Caso de uso Documentação
Traduzir texto específico do setor. Tradução personalizada de serviços de IA
Traduzir texto genérico que não é específico de um setor. O que é o Tradutor de Texto do Azure

IA do Azure para Informação de Documentos

A Linguagem de IA do Azure é um serviço baseado em nuvem que fornece recursos de processamento de linguagem natural (NLP) para compreender e analisar textos. Use esse serviço para ajudar a criar aplicativos inteligentes usando o Language Studio baseado na Web, APIs REST e bibliotecas de clientes.

Funcionalidades

A tabela a seguir fornece uma lista de alguns dos recursos disponíveis no serviço de IA para Informação de Documentos.

Capacidade Descrição
Extração de cartão de visita O modelo de cartão de visita de Informação de Documentos combina recursos de reconhecimento óptico de caracteres (OCR) com modelos de aprendizado profundo para analisar e extrair dados de imagens de cartões de visita. A API analisa cartões de visita impressos, extrai informações importantes, como nome, sobrenome, nome da empresa, endereço de email e número de telefone e retorna uma representação de dados JSON estruturada.
Extração de modelo de contrato O modelo de contrato de informação de Documentos usa recursos de reconhecimento óptico de caracteres (OCR) para analisar e extrair campos-chave e itens de linha de um grupo seleto de entidades contratuais importantes. Os contratos podem ter uma variedade de formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento; extrai informações importantes, como Partes, Jurisdições, ID do Contrato e Título; e retorna uma representação de dados JSON estruturada. Atualmente, o modelo dá suporte a formatos de documento em inglês.
Extração de cartão de crédito O modelo de cartão de crédito/débito de Informação de documentos utiliza recursos de reconhecimento óptico de caracteres (OCR) para analisar e extrair campos importantes de cartões de crédito e débito. Cartões de crédito e cartões de débito podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e arquivos PDF digitais. A API analisa o texto do documento; extrai informações importantes, como número do cartão de crédito, banco emissor e data de validade e retorna uma representação de estruturada de dados JSON. Atualmente, o modelo dá suporte a formatos de documento em inglês.
Extração de cartão de plano de saúde O modelo de cartão de seguro saúde da Informação de Documentos combina recursos de reconhecimento óptico de caracteres (OCR) com modelos de aprendizado profundo para analisar e extrair informações importantes dos cartões de seguro saúde dos EUA. Um cartão de plano de saúde é um documento essencial para o processamento de cuidados de saúde e pode ser analisado digitalmente para integração de pacientes, informações sobre a cobertura financeira, pagamentos sem dinheiro e processamento de pedidos de indenização. O modelo de cartão de plano de saúde analisa as imagens do cartão do plano; extrai informações importantes, como seguradora, membro, prescrição e número do grupo; e retorna uma representação JSON estruturada. Os cartões de planos de saúde podem ter vários formatos e qualidade, incluindo: imagens capturadas por telefone, documentos digitalizados e arquivos PDF digitais.
Extração de documentos fiscais dos EUA O modelo de contrato de Informação de documentos utiliza recursos de reconhecimento óptico de caracteres (OCR) para analisar e extrair campos-chave e itens de linha de um grupo selecionado de documentos fiscais. Os documentos fiscais podem ser de vários formatos e qualidade, incluindo imagens capturadas por telefone, documentos digitalizados e PDFs digitais. A API analisa o texto do documento; extrai informações importantes, como nome do cliente, endereço para cobrança, data de vencimento e valor devido; e retorna uma representação de dados JSON estruturada. O modelo atualmente dá suporte a determinados formatos de documentos fiscais em inglês.
Muito mais… A IA do Azure para Informação de Documentos dá suporte a uma ampla variedade de modelos que permitem adicionar processamento de informação de documentos aos seus aplicativos e fluxos. Você pode usar um modelo específico do domínio predefinido ou treinar um modelo personalizado personalizado para seus casos específicos de necessidade e uso de negócios. A Informação de Documentos pode ser usada com a API REST ou bibliotecas de clientes Python, C#, Java e JavaScript.

Para saber mais sobre como escolher um modelo que funcione para seu cenário, consulte Qual modelo devo escolher?

Próximas etapas