Udostępnij za pośrednictwem


Wprowadzenie do projektów niestandardowych w programie Document Intelligence Studio

Ta zawartość dotyczy:Znacznik wersja 4.0 (GA) | Poprzednie wersje: niebieski znacznik wyboru v3.1 (GA) v3.0 (GA) niebieski znacznik wyboru

Document Intelligence Studio to narzędzie online umożliwiające wizualne eksplorowanie, zrozumienie i integrowanie funkcji z usługi Analizy dokumentów w aplikacjach. Ten przewodnik Szybki start zawiera wskazówki dotyczące konfigurowania projektu niestandardowego w programie Document Intelligence Studio.

Wymagania wstępne dla nowych użytkowników

Zapoznaj się z następującą dokumentacją dotyczącą tworzenia subskrypcji i zasobów, a także konfiguracji uwierzytelniania.

Dodatkowe wymagania wstępne dotyczące projektów niestandardowych

Oprócz konta platformy Azure i zasobu analizy dokumentów lub usług Azure AI potrzebne są następujące elementy:

Kontener usługi Azure Blob Storage

Konto usługi Azure Blob Storage o standardowej wydajności. Kontenery są tworzone do przechowywania i organizowania dokumentów szkoleniowych na koncie magazynu. Jeśli nie wiesz, jak utworzyć konto usługi Azure Storage przy użyciu kontenera, wykonaj następujące przewodniki Szybki start:

  • Create a storage account (Tworzenie konta magazynu). Podczas tworzenia konta magazynu wybierz pozycję Wydajność w warstwie Standardowa w polu Szczegóły wystąpienia → Wydajność.
  • Tworzenie kontenera. Podczas tworzenia kontenera ustaw pole Poziom dostępu publicznego na Kontener (anonimowy dostęp do odczytu dla kontenerów i obiektów blob) w oknie Nowy kontener .

Przypisania ról platformy Azure

W przypadku projektów niestandardowych następujące przypisania ról są wymagane w różnych scenariuszach.

  • Podstawowy

    • Użytkownik usług Cognitive Services: ta rola jest potrzebna dla zasobu usługi Document Intelligence lub Azure AI, aby wytrenować model niestandardowy lub przeprowadzić analizę za pomocą wytrenowanych modeli.
    • Współautor danych obiektu blob usługi Storage: ta rola jest potrzebna dla konta magazynu w celu utworzenia projektu i etykiet danych.
  • Zaawansowani

    • Współautor konta magazynu: ta rola jest potrzebna dla konta magazynu w celu skonfigurowania ustawień mechanizmu CORS (ta akcja jest jednorazowa, jeśli to samo konto magazynu jest używane ponownie).
    • Współautor: ta rola jest potrzebna do utworzenia grupy zasobów i zasobów.

    Uwaga

    Jeśli uwierzytelnianie lokalne (oparte na kluczach) jest wyłączone dla zasobu usługi Analizy dokumentów i konta magazynu, upewnij się, że masz odpowiednio role Współautor danych użytkownika i magazynu usług Cognitive Services, więc masz wystarczające uprawnienia do korzystania z usługi Document Intelligence Studio. Role Współautor i Współautor konta magazynu umożliwiają wyświetlanie listy kluczy, ale nie zezwalają na korzystanie z zasobów, gdy dostęp do klucza jest wyłączony.

Konfigurowanie mechanizmu CORS

Mechanizm CORS (współużytkowanie zasobów między źródłami) musi być skonfigurowany na koncie usługi Azure Storage, aby był dostępny z poziomu programu Document Intelligence Studio. Aby skonfigurować mechanizm CORS w witrynie Azure Portal, musisz mieć dostęp do karty CORS konta magazynu.

  1. Wybierz kartę CORS dla konta magazynu.

    Zrzut ekranu przedstawiający menu ustawień mechanizmu CORS w witrynie Azure Portal.

  2. Zacznij od utworzenia nowego wpisu CORS w usłudze Blob Service.

  3. Ustaw wartość Dozwolone źródła na https://documentintelligence.ai.azure.com.

    Zrzut ekranu przedstawiający konfigurację mechanizmu CORS dla konta magazynu.

    Napiwek

    Można użyć symbolu wieloznakowego "*", a nie określonej domeny, aby umożliwić wszystkim domenom pochodzenia wykonywanie żądań za pośrednictwem mechanizmu CORS.

  4. Wybierz wszystkie dostępne 8 opcji dla dozwolonych metod.

  5. Zatwierdź wszystkie dozwolone nagłówki i uwidocznione nagłówki, wprowadzając element * w każdym polu.

  6. Ustaw maksymalny wiek na 120 sekund lub dowolną akceptowalną wartość.

  7. Aby zapisać zmiany, wybierz przycisk Zapisz w górnej części strony.

Mechanizm CORS powinien być teraz skonfigurowany do używania konta magazynu z programu Document Intelligence Studio.

Zestaw przykładowych dokumentów

  1. Zaloguj się do witryny Azure Portal i przejdź do obszaru Kontenery magazynu konta magazynu>>.

    Zrzut ekranu przedstawiający menu Magazyn danych w witrynie Azure Portal.

  2. Wybierz kontener z listy.

  3. Wybierz pozycję Przekaż z menu w górnej części strony.

    Zrzut ekranu przedstawiający przycisk przekazywania kontenera w witrynie Azure Portal.

  4. Zostanie wyświetlone okno Przekazywanie obiektu blob .

  5. Wybierz pliki do przekazania.

    Zrzut ekranu przedstawiający okno przekazywania obiektu blob w witrynie Azure Portal.

Uwaga

Domyślnie program Studio będzie używać dokumentów znajdujących się w katalogu głównym kontenera. Można jednak używać danych zorganizowanych w folderach, określając ścieżkę folderu w krokach tworzenia projektu formularzy niestandardowych. Zobacz Organizowanie danych w podfolderach

Korzystanie z funkcji programu Document Intelligence Studio

Automatyczne etykietowanie dokumentów przy użyciu wstępnie utworzonych modeli lub jednego z własnych modeli

  • Na niestandardowej stronie etykietowania modelu wyodrębniania można teraz automatycznie oznaczać dokumenty przy użyciu jednego ze wstępnie utworzonych modeli usługi Document Intelligent Service lub wytrenowanych modeli.

    Animowany zrzut ekranu przedstawiający automatyczne etykietowanie w programie Studio.

  • W przypadku niektórych dokumentów możliwe są zduplikowane etykiety po uruchomieniu automatycznego etykietowania. Pamiętaj, aby zmodyfikować etykiety, aby nie było zduplikowanych etykiet na stronie etykietowania.

    Zrzut ekranu przedstawiający ostrzeżenie o zduplikowanych etykietach po automatycznym etykietowaniu.

Tabele automatycznej etykiety

  • Na niestandardowej stronie etykietowania modelu wyodrębniania można teraz automatycznie etykietować tabele w dokumencie bez konieczności ręcznego etykietowania tabel.

    Animowany zrzut ekranu przedstawiający automatyczne etykietowanie tabeli w programie Studio.

Dodawanie plików testowych bezpośrednio do zestawu danych treningowych

  • Po wytrenowaniu niestandardowego modelu wyodrębniania użyj strony testowej, aby poprawić jakość modelu, przekazując dokumenty testowe do zestawu danych trenowania w razie potrzeby.

  • Jeśli dla niektórych etykiet zostanie zwrócony niski współczynnik ufności, pamiętaj, aby poprawnie oznaczyć zawartość. Jeśli nie, dodaj je do zestawu danych szkoleniowych i ponownie określ, aby poprawić jakość modelu.

    Animowany zrzut ekranu przedstawiający sposób dodawania plików testowych do zestawu danych szkoleniowych.

Korzystanie z opcji listy dokumentów i filtrów w projektach niestandardowych

  • Użyj niestandardowej strony etykietowania modelu wyodrębniania, aby łatwo przechodzić przez dokumenty szkoleniowe, korzystając z funkcji wyszukiwania, filtrowania i sortowania.

  • Użyj widoku siatki, aby wyświetlić podgląd dokumentów lub użyć widoku listy, aby łatwiej przewijać dokumenty.

    Zrzut ekranu przedstawiający opcje i filtry widoku listy dokumentów.

Udostępnianie projektu

Łatwe udostępnianie niestandardowych projektów wyodrębniania. Aby uzyskać więcej informacji, zobacz Udostępnianie projektu za pomocą modeli niestandardowych.

Następne kroki

  • Postępuj zgodnie z naszym przewodnikiem migracji analizy dokumentów w wersji 3.1, aby poznać różnice w stosunku do poprzedniej wersji interfejsu API REST.
  • Zapoznaj się z naszymi przewodnikami Szybki start zestawu SDK w wersji 4.0, aby wypróbować funkcje w wersji 3.0 w aplikacjach przy użyciu nowych bibliotek klienckich.
  • Zapoznaj się z naszymi przewodnikami Szybki start interfejsu API REST w wersji 4.0, aby wypróbować funkcje w wersji 3.0 przy użyciu nowego interfejsu API REST.

Rozpocznij pracę z programem Document Intelligence Studio.