Partilhar via


Introdução a projetos personalizados no Document Intelligence Studio

Este conteúdo aplica-se a:marca de verificação v4.0 (GA) | Versões anteriores:Marca de verificação azul v3.1 (GA)Marca de verificação azul v3.0 (GA)

O Document Intelligence Studio é uma ferramenta online para explorar, entender e integrar visualmente recursos do serviço Document Intelligence em seus aplicativos. Este guia de início rápido tem como objetivo fornecer um guia de configuração de um projeto personalizado no Document Intelligence Studio.

Pré-requisitos para novos usuários

Consulte a documentação a seguir para obter informações sobre assinatura e criação de recursos, bem como configuração de autenticação.

Pré-requisitos adicionais para projetos personalizados

Além da conta do Azure e de um recurso de serviços de Inteligência Documental ou IA do Azure, você precisa:

Contêiner de Armazenamento de Blob do Azure

Uma conta de Armazenamento de Blob do Azure de desempenho padrão. Você cria contêineres para armazenar e organizar seus documentos de treinamento em sua conta de armazenamento. Se você não souber como criar uma conta de armazenamento do Azure com um contêiner, siga estes inícios rápidos:

  • Criar uma conta de armazenamento. Ao criar sua conta de armazenamento, selecione Desempenho padrão no campo Detalhes da instância → Desempenho .
  • Crie um contêiner. Ao criar seu contêiner, defina o campo Nível de acesso público como Contêiner (acesso de leitura anônimo para contêineres e blobs) na janela Novo contêiner .

Atribuições de funções do Azure

Para projetos personalizados, as seguintes atribuições de função são necessárias para diferentes cenários.

  • Básica

    • Usuário de Serviços Cognitivos: você precisa dessa função para o recurso de Serviços de Inteligência Documental ou de IA do Azure para treinar o modelo personalizado ou fazer análises com modelos treinados.
    • Contribuidor de Dados de Blob de Armazenamento: Você precisa dessa função para a Conta de Armazenamento criar um projeto e rotular dados.
  • Avançado

    • Colaborador da Conta de Armazenamento: Você precisa dessa função para que a Conta de Armazenamento configure as configurações do CORS (essa ação é um esforço único se a mesma conta de armazenamento for reutilizada).
    • Colaborador: você precisa dessa função para criar um grupo de recursos e recursos.

    Nota

    Se a autenticação local (baseada em chave) estiver desabilitada para seu recurso de serviço de Inteligência Documental e conta de armazenamento, certifique-se de obter as funções de Usuário de Serviços Cognitivos e Colaborador de Dados de Blob de Armazenamento , respectivamente, para que você tenha permissões suficientes para usar o Document Intelligence Studio. As funções Conta de Armazenamento, Colaborador e Colaborador só permitem listar chaves, mas não lhe dão permissão para usar os recursos quando o acesso à chave está desativado.

Configurar o CORS

O CORS (Cross Origin Resource Sharing) precisa ser configurado em sua conta de armazenamento do Azure para que possa ser acessado a partir do Document Intelligence Studio. Para configurar o CORS no portal do Azure, você precisa acessar a guia CORS da sua conta de armazenamento.

  1. Selecione a guia CORS para a conta de armazenamento.

    Captura de ecrã do menu de definição CORS no portal do Azure.

  2. Comece criando uma nova entrada CORS no serviço Blob.

  3. Defina as origens permitidas como https://documentintelligence.ai.azure.com.

    Captura de tela que mostra a configuração do CORS para uma conta de armazenamento.

    Gorjeta

    Você pode usar o caractere curinga '*' em vez de um domínio especificado para permitir que todos os domínios de origem façam solicitações via CORS.

  4. Selecione todas as 8 opções disponíveis para métodos permitidos.

  5. Aprove todos os cabeçalhos permitidos e Expostos inserindo um * em cada campo.

  6. Defina a Idade Máxima para 120 segundos ou qualquer valor aceitável.

  7. Para salvar as alterações, selecione o botão Salvar na parte superior da página.

O CORS agora deve ser configurado para usar a conta de armazenamento do Document Intelligence Studio.

Conjunto de documentos de exemplo

  1. Entre no portal do Azure e navegue até Sua conta>de armazenamento Contêineres de armazenamento>de dados.

    Captura de ecrã do menu Armazenamento de dados no portal do Azure.

  2. Selecione um contêiner na lista.

  3. Selecione Carregar no menu na parte superior da página.

    Captura de ecrã do botão de carregamento de contentor no portal do Azure.

  4. A janela Upload blob é exibida.

  5. Selecione os seus ficheiros para carregar.

    Captura de ecrã da janela de blob de carregamento no portal do Azure.

Nota

Por padrão, o Studio usará documentos localizados na raiz do contêiner. No entanto, você pode usar dados organizados em pastas especificando o caminho da pasta nas etapas de criação do projeto de formulário personalizado. Consulte Organizar seus dados em subpastas

Usar os recursos do Document Intelligence Studio

Documentos de etiquetagem automática com modelos pré-construídos ou um dos seus próprios modelos

  • Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente seus documentos usando um dos modelos pré-construídos do Document Intelligent Service ou seus modelos treinados.

    Captura de tela animada mostrando a etiquetagem automática no Studio.

  • Para alguns documentos, é possível duplicar etiquetas depois de executar a etiqueta automática. Certifique-se de modificar os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.

    Captura de ecrã a mostrar aviso de etiqueta duplicada após etiquetagem automática.

Tabelas de etiquetas automáticas

  • Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.

    Captura de tela animada mostrando a etiquetagem automática da tabela no Studio.

Adicionar arquivos de teste diretamente ao seu conjunto de dados de treinamento

  • Depois de treinar um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo carregando documentos de teste para o conjunto de dados de treinamento, se necessário.

  • Se uma pontuação de confiança baixa for retornada para alguns rótulos, certifique-se de rotular corretamente seu conteúdo. Caso contrário, adicione-os ao conjunto de dados de treinamento e rerotule para melhorar a qualidade do modelo.

    Captura de tela animada mostrando como adicionar arquivos de teste ao conjunto de dados de treinamento.

Faça uso das opções e filtros da lista de documentos em projetos personalizados

  • Use a página de rotulagem de modelo de extração personalizada para navegar pelos documentos de treinamento com facilidade, usando o recurso de pesquisa, filtro e classificação por recurso.

  • Utilize a vista de grelha para pré-visualizar documentos ou utilize a vista de lista para percorrer os documentos mais facilmente.

    Captura de ecrã das opções e filtros da vista de lista de documentos.

Partilha de projetos

Compartilhe projetos de extração personalizados com facilidade. Para obter mais informações, consulte Compartilhamento de projetos com modelos personalizados.

Próximos passos

  • Siga nosso guia de migração do Document Intelligence v3.1 para aprender as diferenças da versão anterior da API REST.
  • Explore nossos inícios rápidos do SDK v4.0 para experimentar os recursos da v3.0 em seus aplicativos usando as novas bibliotecas cliente.
  • Consulte nossos inícios rápidos da API REST v4.0 para experimentar os recursos da v3.0 usando a nova API REST.

Comece a usar o Document Intelligence Studio.