Udostępnij za pośrednictwem


Wprowadzenie: Document Intelligence Studio

Ta zawartość dotyczy:Znacznik wersja 4.0 (wersja zapoznawcza) | Poprzednie wersje: niebieski znacznik wyboru v3.1 (GA) v3.0 (GA) niebieski znacznik wyboru

Document Intelligence Studio to narzędzie online umożliwiające wizualne eksplorowanie, zrozumienie i integrowanie funkcji z usługi Analizy dokumentów w aplikacjach. Możesz rozpocząć od eksplorowania wstępnie wytrenowanych modeli przy użyciu przykładu lub własnych dokumentów. Możesz również tworzyć projekty do tworzenia niestandardowych modeli szablonów i odwoływać się do modeli w aplikacjach przy użyciu zestawu SDK języka Python i innych przewodników Szybki start.

Wymagania wstępne dla nowych użytkowników

Do korzystania z programu Document Intelligence Studio potrzebne są następujące zasoby i ustawienia:

Napiwek

Utwórz zasób usług Azure AI, jeśli planujesz uzyskać dostęp do wielu usług azure AI w ramach jednego punktu końcowego/klucza. W przypadku dostępu tylko do analizy dokumentów utwórz zasób analizy dokumentów. Należy pamiętać, że jeśli zamierzasz używać uwierzytelniania firmy Microsoft Entra, potrzebujesz zasobu z jedną usługą.

Analiza dokumentów obsługuje teraz uwierzytelnianie tokenu usługi AAD dodatkowe do uwierzytelniania lokalnego (opartego na kluczach) podczas uzyskiwania dostępu do zasobów analizy dokumentów i kont magazynu. Postępuj zgodnie z poniższymi instrukcjami, aby skonfigurować prawidłowe role dostępu, zwłaszcza jeśli zasoby są stosowane z zasadami DisableLocalAuth .

  • Prawidłowe przypisania ról platformy Azure w celu analizy dokumentów i wstępnie utworzonych modeli wymagane są następujące przypisania ról w różnych scenariuszach.

    • Podstawowy ✔️ użytkownik usług Cognitive Services: ta rola jest potrzebna w zasobie usługi Document Intelligence lub Azure AI, aby wprowadzić stronę analizy.

    • Współautor zaawansowany ✔️: ta rola jest potrzebna do tworzenia grupy zasobów, usługi Analizy dokumentów lub zasobów usług Azure AI.

      Aby uzyskać więcej informacji na temat autoryzacji, zobacz Zasady autoryzacji usługi Document Intelligence Studio.

      Uwaga

      Jeśli lokalne (oparte na kluczach) uwierzytelnianie jest wyłączone dla zasobu usługi Document Intelligence Service, upewnij się, że uzyskasz rolę użytkownika usług Cognitive Services, a token usługi AAD będzie używany do uwierzytelniania żądań w usłudze Document Intelligence Studio. Rola Współautor umożliwia wyświetlanie listy kluczy, ale nie daje uprawnień do korzystania z zasobu, gdy dostęp do klucza jest wyłączony.

  • Po skonfigurowaniu zasobu możesz wypróbować różne modele oferowane przez narzędzie Document Intelligence Studio. Na pierwszej stronie wybierz dowolny model analizy dokumentów, aby spróbować użyć metody bez kodu.

  • Aby przetestować dowolną analizę dokumentu lub wstępnie utworzone modele, wybierz model i użyj jednego z przykładowych dokumentów lub przekaż własny dokument do analizy. Wynik analizy jest wyświetlany po prawej stronie w oknie content-result-code.

  • Modele niestandardowe należy wytrenować w dokumentach. Zobacz Omówienie modeli niestandardowych, aby zapoznać się z omówieniem modeli niestandardowych.

Uwierzytelnianie

Przejdź do programu Document Intelligence Studio. Jeśli po raz pierwszy się zalogujesz, zostanie wyświetlone okno podręczne z monitem o skonfigurowanie zasobu usługi. Zgodnie z zasadami organizacji masz jedną lub dwie opcje:

  • Uwierzytelnianie Firmy Microsoft Entra: dostęp za pomocą zasobu (zalecane).

    • Wybierz istniejącą subskrypcję.

    • Wybierz istniejącą grupę zasobów w ramach subskrypcji lub utwórz nową.

    • Wybierz istniejący zasób analizy dokumentów lub usług Azure AI.

      Zrzut ekranu przedstawiający formularz konfigurowania zasobu usługi z programu Document Intelligence Studio.

  • Uwierzytelnianie lokalne: dostęp za pomocą punktu końcowego i klucza interfejsu API.

    • Pobierz punkt końcowy i klucz z witryny Azure Portal.

    • Przejdź do strony przeglądu zasobu i wybierz pozycję Klucze i punkt końcowy na lewym pasku nawigacyjnym.

    • Wprowadź wartości w odpowiednich polach.

      Zrzut ekranu przedstawiający stronę kluczy i punktu końcowego w witrynie Azure Portal.

  • Po zweryfikowaniu scenariusza w narzędziu Document Intelligence Studio użyj bibliotek klienckich języka C#, Java, JavaScript lub Python albo interfejsu API REST, aby rozpocząć dołączanie modeli analizy dokumentów do własnych aplikacji.

Aby dowiedzieć się więcej na temat każdego modelu, zobacz nasze strony koncepcji.

Wyświetlanie szczegółów zasobu

Aby wyświetlić szczegóły zasobów, takie jak nazwa i warstwa cenowa, wybierz ikonę Ustawienia w prawym górnym rogu strony głównej usługi Document Intelligence Studio i wybierz kartę Zasób . Jeśli masz dostęp do innych zasobów, możesz również przełączyć zasoby.

Dodano wymagania wstępne dotyczące projektów niestandardowych

Oprócz konta platformy Azure i zasobu analizy dokumentów lub usług Azure AI potrzebne są następujące elementy:

Kontener usługi Azure Blob Storage

Konto usługi Azure Blob Storage o standardowej wydajności. Kontenery są tworzone do przechowywania i organizowania dokumentów szkoleniowych na koncie magazynu. Jeśli nie wiesz, jak utworzyć konto usługi Azure Storage przy użyciu kontenera, wykonaj następujące przewodniki Szybki start:

  • Create a storage account (Tworzenie konta magazynu). Podczas tworzenia konta magazynu wybierz pozycję Wydajność w warstwie Standardowa w polu Szczegóły wystąpienia → Wydajność.
  • Tworzenie kontenera. Podczas tworzenia kontenera ustaw pole Poziom dostępu publicznego na Kontener (anonimowy dostęp do odczytu dla kontenerów i obiektów blob) w oknie Nowy kontener .

Przypisania ról platformy Azure

W przypadku projektów niestandardowych następujące przypisania ról są wymagane w różnych scenariuszach.

  • Podstawowy

    • Użytkownik usług Cognitive Services: ta rola jest potrzebna dla zasobu usługi Document Intelligence lub Azure AI, aby wytrenować model niestandardowy lub przeprowadzić analizę za pomocą wytrenowanych modeli.
    • Współautor danych obiektu blob usługi Storage: ta rola jest potrzebna dla konta magazynu w celu utworzenia projektu i etykiet danych.
  • Zaawansowani

    • Współautor konta magazynu: ta rola jest potrzebna dla konta magazynu w celu skonfigurowania ustawień mechanizmu CORS (ta akcja jest jednorazowa, jeśli to samo konto magazynu jest używane ponownie).
    • Współautor: ta rola jest potrzebna do utworzenia grupy zasobów i zasobów.

    Uwaga

    Jeśli uwierzytelnianie lokalne (oparte na kluczach) jest wyłączone dla zasobu usługi Analizy dokumentów i konta magazynu, upewnij się, że masz odpowiednio role Współautor danych użytkownika i magazynu usług Cognitive Services, więc masz wystarczające uprawnienia do korzystania z usługi Document Intelligence Studio. Role Współautor i Współautor konta magazynu umożliwiają wyświetlanie listy kluczy, ale nie zezwalają na korzystanie z zasobów, gdy dostęp do klucza jest wyłączony.

Konfigurowanie mechanizmu CORS

Mechanizm CORS (współużytkowanie zasobów między źródłami) musi być skonfigurowany na koncie usługi Azure Storage, aby był dostępny z poziomu programu Document Intelligence Studio. Aby skonfigurować mechanizm CORS w witrynie Azure Portal, musisz mieć dostęp do karty CORS konta magazynu.

  1. Wybierz kartę CORS dla konta magazynu.

    Zrzut ekranu przedstawiający menu ustawień mechanizmu CORS w witrynie Azure Portal.

  2. Zacznij od utworzenia nowego wpisu CORS w usłudze Blob Service.

  3. Ustaw wartość Dozwolone źródła na https://documentintelligence.ai.azure.com.

    Zrzut ekranu przedstawiający konfigurację mechanizmu CORS dla konta magazynu.

    Napiwek

    Można użyć symbolu wieloznakowego "*", a nie określonej domeny, aby umożliwić wszystkim domenom pochodzenia wykonywanie żądań za pośrednictwem mechanizmu CORS.

  4. Wybierz wszystkie dostępne 8 opcji dla dozwolonych metod.

  5. Zatwierdź wszystkie dozwolone nagłówki i uwidocznione nagłówki, wprowadzając element * w każdym polu.

  6. Ustaw maksymalny wiek na 120 sekund lub dowolną akceptowalną wartość.

  7. Aby zapisać zmiany, wybierz przycisk Zapisz w górnej części strony.

Mechanizm CORS powinien być teraz skonfigurowany do używania konta magazynu z programu Document Intelligence Studio.

Zestaw przykładowych dokumentów

  1. Zaloguj się do witryny Azure Portal i przejdź do obszaru Kontenery magazynu konta magazynu>>.

    Zrzut ekranu przedstawiający menu Magazyn danych w witrynie Azure Portal.

  2. Wybierz kontener z listy.

  3. Wybierz pozycję Przekaż z menu w górnej części strony.

    Zrzut ekranu przedstawiający przycisk przekazywania kontenera w witrynie Azure Portal.

  4. Zostanie wyświetlone okno Przekazywanie obiektu blob .

  5. Wybierz pliki do przekazania.

    Zrzut ekranu przedstawiający okno przekazywania obiektu blob w witrynie Azure Portal.

Uwaga

Domyślnie program Studio będzie używać dokumentów znajdujących się w katalogu głównym kontenera. Można jednak używać danych zorganizowanych w folderach, określając ścieżkę folderu w krokach tworzenia projektu formularzy niestandardowych. Zobacz Organizowanie danych w podfolderach

Korzystanie z funkcji programu Document Intelligence Studio

Automatyczne etykietowanie dokumentów przy użyciu wstępnie utworzonych modeli lub jednego z własnych modeli

  • Na niestandardowej stronie etykietowania modelu wyodrębniania można teraz automatycznie oznaczać dokumenty przy użyciu jednego ze wstępnie utworzonych modeli usługi Document Intelligent Service lub wytrenowanych modeli.

    Animowany zrzut ekranu przedstawiający automatyczne etykietowanie w programie Studio.

  • W przypadku niektórych dokumentów możliwe są zduplikowane etykiety po uruchomieniu automatycznego etykietowania. Pamiętaj, aby zmodyfikować etykiety, aby nie było zduplikowanych etykiet na stronie etykietowania.

    Zrzut ekranu przedstawiający ostrzeżenie o zduplikowanych etykietach po automatycznym etykietowaniu.

Tabele automatycznej etykiety

  • Na niestandardowej stronie etykietowania modelu wyodrębniania można teraz automatycznie etykietować tabele w dokumencie bez konieczności ręcznego etykietowania tabel.

    Animowany zrzut ekranu przedstawiający automatyczne etykietowanie tabeli w programie Studio.

Dodawanie plików testowych bezpośrednio do zestawu danych treningowych

  • Po wytrenowaniu niestandardowego modelu wyodrębniania użyj strony testowej, aby poprawić jakość modelu, przekazując dokumenty testowe do zestawu danych trenowania w razie potrzeby.

  • Jeśli dla niektórych etykiet zostanie zwrócony niski współczynnik ufności, pamiętaj, aby poprawnie oznaczyć zawartość. Jeśli nie, dodaj je do zestawu danych szkoleniowych i ponownie określ, aby poprawić jakość modelu.

    Animowany zrzut ekranu przedstawiający sposób dodawania plików testowych do zestawu danych szkoleniowych.

Korzystanie z opcji listy dokumentów i filtrów w projektach niestandardowych

  • Użyj niestandardowej strony etykietowania modelu wyodrębniania, aby łatwo przechodzić przez dokumenty szkoleniowe, korzystając z funkcji wyszukiwania, filtrowania i sortowania.

  • Użyj widoku siatki, aby wyświetlić podgląd dokumentów lub użyć widoku listy, aby łatwiej przewijać dokumenty.

    Zrzut ekranu przedstawiający opcje i filtry widoku listy dokumentów.

Udostępnianie projektu

Łatwe udostępnianie niestandardowych projektów wyodrębniania. Aby uzyskać więcej informacji, zobacz Udostępnianie projektu za pomocą modeli niestandardowych.

Następne kroki

  • Postępuj zgodnie z naszym przewodnikiem migracji analizy dokumentów w wersji 3.1, aby poznać różnice w stosunku do poprzedniej wersji interfejsu API REST.
  • Zapoznaj się z naszymi przewodnikami Szybki start zestawu SDK w wersji 4.0, aby wypróbować funkcje w wersji 3.0 w aplikacjach przy użyciu nowych bibliotek klienckich.
  • Zapoznaj się z naszymi przewodnikami Szybki start interfejsu API REST w wersji 4.0, aby wypróbować funkcje w wersji 3.0 przy użyciu nowego interfejsu API REST.

Rozpocznij pracę z programem Document Intelligence Studio.