Compartilhar via


Introdução a projetos personalizados no Estúdio da Informação de Documentos

Este conteúdo se aplica a:marca de seleção v4.0 (versão prévia) | Versões anteriores:marca de seleção azulv3.1 (GA) marca de seleção azul v3.0 (GA)

O Document Intelligence Studio é uma ferramenta online para explorar visualmente, entender e integrar recursos do serviço Document Intelligence em seus aplicativos. Este guia de início rápido tem como objetivo fornecer um guia de configuração de um projeto personalizado no Estúdio da Informação de Documentos.

Pré-requisitos para novos usuários

Consulte a documentação a seguir para criação de recursos e assinatura, bem como configuração de autenticação.

Pré-requisitos adicionais para projetos personalizados

Além da conta do Azure e de um recurso de serviços do Document Intelligence ou da IA do Azure, você precisa:

Contêiner do Armazenamento de Blob do Azure

O Desempenho Standard de uma conta de Armazenamento de Blobs do Azure. Você criará contêineres para armazenar e organizar seus documentos de treinamento na sua conta de armazenamento. Se você não sabe como criar uma conta de armazenamento do Azure com um contêiner, siga este início rápido:

  • Criar uma conta de armazenamento. Ao criar a conta de armazenamento, certifique-se de selecionar desempenho Padrão no campo Detalhes da instância → Desempenho.
  • Criar um contêiner. Ao criar o contêiner, defina o campo Nível de acesso público como Contêiner (acesso de leitura anônimo de contêineres e blobs) na janela Novo contêiner.

Atribuições de função do Azure

Para projetos personalizados, as atribuições de função a seguir são necessárias para cenários diferentes.

  • Basic

    • Usuário dos Serviços Cognitivos: você precisa dessa função para o recurso de Informação de Documentos ou serviços de IA do Azure para treinar o modelo personalizado ou fazer análises com modelos treinados.
    • Colaborador de dados de blob de armazenamento: você precisa dessa função para que a Conta de Armazenamento crie um projeto e rotule dados.
  • Avançado

    • Colaborador da conta de armazenamento: essa função é necessária para que a conta de armazenamento defina as configurações do CORS (se a mesma conta de armazenamento for reutilizada, essa etapa é única).
    • Colaborador: você precisa dessa função para criar recursos e um grupo de recursos.

    Observação

    Se a autenticação local (baseada em chave) estiver desabilitada para sua conta de armazenamento e recurso de serviço de Informação de Documentos, certifique-se de obter funções de Usuário dos Serviços Cognitivos e Colaborador de Dados de Blob de Armazenamento, respectivamente, para que você tenha permissões suficientes para usar o Estúdio da Informação de Documentos. As funções Colaborador da Conta de Armazenamento e Colaborador só permitem que você liste chaves, mas não lhe dá permissão para usar os recursos quando o acesso à chave é desabilitado.

Configurar o CORS

O CORS (Cross Origin Resource Sharing) precisa ser configurado em sua conta de armazenamento do Azure para que ela possa ser acessado pelo Document Intelligence Studio. Para configurar o CORS no portal do Azure, você precisará de acesso à guia CORS da sua conta de armazenamento.

  1. Selecione a guia CORS da conta de armazenamento.

    Captura de tela do menu de configuração do CORS no portal do Azure.

  2. Comece criando uma entrada do CORS no serviço Blob.

  3. Defina Origens permitidas como https://documentintelligence.ai.azure.com.

    Captura de tela que mostra a configuração CORS para uma conta de armazenamento.

    Dica

    Você pode usar o caractere curinga '*' em vez de um domínio especificado para permitir que todos os domínios de origem façam solicitações por CORS.

  4. Selecione todas as oito opções disponíveis para Métodos permitidos.

  5. Aprove todos os Cabeçalhos permitidos e Cabeçalhos expostos inserindo um * em cada campo.

  6. Defina a Idade máxima como 120 segundos ou qualquer valor aceitável.

  7. Para salvar as alterações, selecione o botão Salvar na parte superior da página.

O CORS agora deve ser configurado para usar a conta de armazenamento do Document Intelligence Studio.

Conjunto de documentos de exemplo

  1. Acesse o portal do Azure e navegue até Sua conta de armazenamento>Armazenamento de dados>Contêineres.

    Captura de tela do menu Armazenamento de dados no portal do Azure.

  2. Selecione um contêiner na lista.

  3. Selecione Upload no menu na parte superior da página.

    Captura de tela do botão de upload de contêiner no portal do Azure.

  4. A janela Carregar blob é exibida.

  5. Selecione os arquivos que serão carregados.

    Captura de tela da janela de upload de blob no portal do Azure.

Observação

Por padrão, o Studio utilizará os documentos que estão localizados na raiz do seu contêiner. No entanto, você pode usar dados organizados em pastas ao especificar o caminho da pasta na etapa de criação de projeto do formulário personalizado. Consulte Organizar os dados em subpastas

Usar recursos do Document Intelligence Studio

Rotular automaticamente documentos com modelos predefinidos ou com um de seus próprios modelos

  • Na página de rotulagem do modelo de extração personalizado, agora você pode rotular automaticamente seus documentos usando um dos modelos predefinidos do Serviço de Informação de Documentos ou seus modelos treinados.

    Captura de tela animada mostrando a rotulagem automática no Estúdio.

  • Para alguns documentos, rótulos duplicados após a execução do rótulo automático são possíveis. Modifique os rótulos para que não haja rótulos duplicados na página de rotulagem posteriormente.

    Captura de tela mostrando o aviso de rótulo duplicado após a rotulagem automática.

Tabelas com rótulo automática

  • Na página de rotulagem de modelo de extração personalizada, agora você pode rotular automaticamente as tabelas no documento sem precisar rotular as tabelas manualmente.

    Captura de tela animada mostrando a rotulagem automática no Estúdio.

Adicione arquivos de teste diretamente ao seu conjunto de dados de treinamento

  • Uma vez treinado um modelo de extração personalizado, use a página de teste para melhorar a qualidade do modelo, carregando documentos de teste para o conjunto de dados de treinamento, se necessário.

  • Se uma pontuação de confiança baixa for retornada para alguns rótulos, certifique-se de rotular corretamente seu conteúdo. Caso contrário, adicione-os ao conjunto de dados de treinamento e re-rótulo para melhorar a qualidade do modelo.

    Captura de tela animada mostrando como adicionar arquivos de teste ao conjunto de dados de treinamento.

Use as opções e os filtros da lista de documentos em projetos personalizados

  • Use a página de rotulagem de modelo de extração personalizada para navegar por seus documentos de treinamento com facilidade fazendo uso da pesquisa, filtro e classificação por recurso.

  • Utilize o modo de exibição de grade para visualizar documentos ou use a exibição de lista para percorrer os documentos com mais facilidade.

    Captura de tela das opções e filtros de exibição de lista de documentos.

Compartilhamento de projetos

Compartilhe projetos de extração personalizados com facilidade. Para obter mais informações, consulte Compartilhamento de projetos com modelos personalizados.

Próximas etapas

Introdução ao Document Intelligence Studio.