Freigeben über


Erste Schritte: Dokument Intelligenz-Studio

Dieser Inhalt gilt für:Häkchen Version 4.0 (Vorschau) | Frühere Versionen: Blaues Häkchen Version 3.1 (GA) Blaues Häkchen Version 3.0 (GA)

Dokument Intelligenz-Studio ist ein Onlinetool für das visuelle Erkunden, Verstehen und Integrieren der Features des Dokument Intelligenz-Diensts in Ihre Anwendungen. Sie können loslegen, indem Sie die vortrainierten Modelle mit Beispieldokumenten oder Ihren eigenen Dokumenten erkunden. Sie können auch Projekte für die Entwicklung von benutzerdefinierten Vorlagenmodellen erstellen und in Ihren Anwendungen darauf verweisen, indem Sie die Informationen zum Python SDK und andere Schnellstartanleitungen verwenden.

Voraussetzungen für neue Benutzer

Um Dokument Intelligenz-Studio zu verwenden, benötigen Sie folgende Ressourcen und Einstellungen:

Tipp

Erstellen Sie eine Azure KI Services-Ressource, wenn Sie planen, auf mehrere Azure KI Services unter einem einzelnen Endpunkt/Schlüssel zuzugreifen. Erstellen Sie nur für den Zugriff auf Dokument Intelligenz eine Dokument Intelligenz-Ressource. Beachten Sie, dass Sie eine Einzeldienstressource benötigen, wenn Sie die Microsoft Entra-Authentifizierung verwenden möchten.

Dokument Intelligenz unterstützt jetzt beim Zugriff auf die Ressourcen und die Speicherkonten von Dokument Intelligenz zusätzlich zur lokalen (schlüsselbasierten) Authentifizierung die AAD-Tokenauthentifizierung. Befolgen Sie die folgenden Anweisungen, um die richtigen Zugriffsrollen einzurichten – insbesondere dann, wenn Ihre Ressourcen mit der DisableLocalAuth-Richtlinie angewendet werden.

  • Azure-Rollenzuweisungen mit korrektem Bereich Für Dokumentanalysemodelle und vordefinierte Modelle sind die folgenden Rollenzuweisungen für verschiedene Szenarien erforderlich.

    • Basic ✔️ Cognitive Services-Benutzer: Sie benötigen diese Rolle für Dokument Intelligenz- oder Azure KI Services-Ressourcen, um die Analyseseite aufzurufen.

    • Advanced ✔️ Mitwirkender: Sie benötigen diese Rolle zum Erstellen einer Ressourcengruppe, eines Dokument Intelligenz-Diensts oder einer Azure KI Services-Ressource.

      Weitere Informationen zur Autorisierung finden Sie in den Autorisierungsrichtlinien von Dokument Intelligenz Studio.

      Hinweis

      Wenn die lokale (schlüsselbasiert) Authentifizierung für Ihre Dokument Intelligenz-Dienstressource deaktiviert ist, müssen Sie die Rolle Cognitive Services-Benutzer erhalten, und Ihr AAD-Token wird zum Authentifizieren von Anforderungen in Dokument Intelligenz Studio verwendet. Die Rolle Mitwirkender ermöglicht Ihnen lediglich das Auflisten von Schlüsseln. Sie erteilt Ihnen jedoch nicht die Berechtigung, die Ressource zu verwenden, wenn der Schlüsselzugriff deaktiviert ist.

  • Nachdem Ihre Ressource konfiguriert wurde, können Sie die verschiedenen Modelle ausprobieren, die von Dokument Intelligenz Studio angeboten werden. Wählen Sie auf der Startseite ein beliebiges Dokument Intelligenz-Modell aus, um es ohne Code zu verwenden.

  • Um eines der Dokumentanalyse- oder vordefinierten Modelle zu testen, wählen Sie das Modell aus, und verwenden Sie eines der Beispieldokumente, oder laden Sie Ihr eigenes Dokument hoch, um es zu analysieren. Das Analyseergebnis wird rechts im Inhaltsergebniscodefenster angezeigt.

  • Benutzerdefinierte Modelle müssen mit Ihren Dokumenten trainiert werden. Eine Übersicht über benutzerdefinierte Modelle finden Sie in Übersicht über benutzerdefinierte Modelle.

Authentifizierung

Navigieren Sie zu Dokument Intelligenz-Studio. Wenn Sie sich zum ersten Mal anmelden, wird ein Popupfenster angezeigt, in dem Sie auffordert werden, Ihre Dienstressource zu konfigurieren. Gemäß der Richtlinie Ihrer Organisation haben Sie eine oder zwei Optionen:

  • Microsoft Entra-Authentifizierung: Zugriff nach Resource (empfohlen).

    • Wählen Sie Ihr bestehendes Abonnement aus.

    • Wählen Sie eine bestehende Ressourcengruppe innerhalb Ihres Abonnements aus, oder erstellen Sie eine neue Gruppe.

    • Wählen Sie Ihre vorhandene Dokument Intelligenz- oder Azure KI Services-Ressource aus.

      Screenshot der Konfiguration des Dienstressourcenformulars aus dem Dokument Intelligenz Studio.

  • Lokale Authentifizierung: Zugriff nach API-Endpunkt und Schlüssel.

    • Rufen Sie Ihren Endpunkt und Schlüssel im Azure-Portal ab.

    • Wechseln Sie zur Übersichtsseite für Ihre Ressource, und wählen Sie in der linken Navigationsleiste Schlüssel und Endpunkt aus.

    • Geben Sie die Werte in die entsprechenden Felder ein.

      Screenshot der Seite

  • Nachdem Sie das Szenario in Document Intelligence Studio überprüft haben, verwenden Sie die Clientbibliotheken von C#, Java, JavaScript oder Python oder die REST-API, um mit der Integration von Dokument Intelligenz-Modellen in Ihre eigenen Anwendungen zu beginnen.

Weitere Informationen zu den einzelnen Modellen finden Sie auf den Konzeptseiten.

Anzeigen von Ressourcendetails

Zum Anzeigen von Ressourcendetails wie Name und Tarif klicken Sie auf das Symbol Einstellungen in der oberen rechten Ecke der Startseite von Dokument Intelligenz-Studio und wählen Sie die Registerkarte Ressource aus. Wenn Sie Zugriff auf andere Ressourcen haben, können Sie auch die Ressourcen wechseln.

Hinzugefügte Voraussetzungen für benutzerdefinierte Projekte

Zusätzlich zum Azure-Konto und einer Dokument Intelligenz- oder Azure KI Services-Ressource benötigen Sie Folgendes:

Azure Blob Storage-Container

Ein Azure Blob Storage-Konto mit Standardleistung. Sie erstellen Container zum Speichern und Organisieren Ihrer Trainingsdokumente unter Ihrem Speicherkonto. Wenn Sie nicht wissen, wie Sie ein Azure Speicherkonto mit einem Container erstellen können, befolgen Sie diese Schnellstarts:

  • Informationen zu Azure-Speicherkonten Stellen Sie bei der Erstellung Ihres Speicherkontos sicher, dass Sie Leistung Standard im Feld Instanzdetails -> Leistung auswählen.
  • Erstellen Sie einen Container. Stellen Sie bei der Erstellung Ihres Containers das Feld Öffentliche Zugriffsebene auf Container(anonymer Lesezugriff für Container und Blobs) im dem Fenster Neuer Container.

Azure-Rollenzuweisungen

Für benutzerdefinierte Projekte sind die folgenden Rollenzuweisungen für verschiedene Szenarien erforderlich:

  • Grundlegend

    • Cognitive Services-Benutzer: Sie benötigen diese Rolle für Dokument Intelligenz- oder Azure KI Services-Ressourcen, um das benutzerdefinierte Modell zu trainieren oder Analysen mit trainierten Modellen durchzuführen.
    • Mitwirkender an Storage-Blobdaten: Sie benötigen diese Rolle für das Speicherkonto, um ein Projekt zu erstellen und Daten zu beschriften.
  • Erweitert

    • Speicherkontomitwirkender: Sie benötigen diese Rolle für das Speicherkonto, um CORS-Einstellungen einzurichten (diese Aktion muss nur einmal ausgeführt werden, wenn dasselbe Speicherkonto wiederverwendet wird).
    • Mitwirkender: Sie benötigen diese Rolle, um eine Ressourcengruppe und Ressourcen zu erstellen.

    Hinweis

    Wenn die lokale (schlüsselbasierte) Authentifizierung für Ihr Dokument Intelligenz-Dienstressourcen- und Speicherkonto deaktiviert ist, müssen Sie die Rollen Cognitive Services-Benutzer bzw. Storage Blob-Datenmitwirkender abrufen, sodass Sie über ausreichende Berechtigungen zum Verwenden von Dokument Intelligenz-Studio verfügen. Die Rollen Speicherkontomitwirkender und Mitwirkender erlauben Ihnen nur das Auflisten von Schlüsseln, geben Ihnen aber nicht das Recht, die Ressourcen zu verwenden, wenn der Schlüsselzugriff deaktiviert ist.

Konfigurieren von CORS

Für Ihr Azure-Speicherkonto muss CORS (Cross Origin Resource Sharing) konfiguriert sein, damit es über das Dokument Intelligenz-Studio zugänglich ist. Zum Konfigurieren von CORS im Azure-Portal benötigen Sie Zugriff auf die Registerkarte „CORS“ Ihres Speicherkontos.

  1. Wählen Sie die Registerkarte „CORS“ für das Speicherkonto aus.

    Screenshot des CORS-Einstellungsmenüs im Azure-Portal.

  2. Erstellen Sie zunächst einen neuen CORS-Eintrag im Blob-Dienst.

  3. Setzen Sie die Erlaubten Ursprünge auf https://documentintelligence.ai.azure.com.

    Screenshot: CORS-Konfiguration für ein Speicherkonto

    Tipp

    Sie können anstelle der Domäne auch das Platzhalterzeichen „*“ verwenden, um allen Ursprungsdomänen die Ausführung von CORS-Anforderungen zu erlauben.

  4. Wählen Sie für Zulässige Methoden alle verfügbaren acht Optionen aus.

  5. Genehmigen Sie die Angaben für Zulässige Header und Verfügbar gemachte Header, indem Sie in jedes Feld ein Sternchen (*) eingeben.

  6. Legen Sie für Max. Alter 120 Sekunden oder einen anderen gültigen Wert ein.

  7. Wählen Sie oben auf der Seite die Schaltfläche „Speichern“ aus, um die Änderungen zu speichern.

CORS sollte jetzt für die Verwendung des Speicherkontos über Dokument Intelligenz-Studio konfiguriert sein.

Gruppe von Beispieldokumenten

  1. Melden Sie sich beim Azure-Portal an, und navigieren Sie zu Ihr Speicherkonto>Datenspeicher>Container.

    Screenshot des Menüs Datenspeicher im Azure-Portal

  2. Wählen Sie einen Container aus der Liste aus.

  3. Wählen Sie Hochladen aus dem Menü am oberen Rand der Seite.

    Screenshot der Schaltfläche zum Hochladen von Containern im Azure-Portal

  4. Das Fenster Blob hochladen wird angezeigt.

  5. Wählen Sie Ihre Dateien zum Hochladen aus.

    Screenshot des Blob-Upload-Fensters im Azure-Portal

Hinweis

Standardmäßig verwendet Studio Dokumente, die sich im Stammverzeichnis Ihres Containers befinden. Sie können aber auch Daten verwenden, die in Ordnern angeordnet sind, indem Sie den Pfad zum Ordner in den Schritten zum Erstellen des Projekts für benutzerdefinierte Formulare angeben. Siehe Organisieren Sie Ihre Daten in Unterordnern

Verwenden von Dokument Intelligenz Studio-Features

Automatische Beschriftung von Dokumenten mit vordefinierten Modellen oder einem Ihrer eigenen Modelle

  • Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie Ihre Dokumente jetzt automatisch anhand eines der vordefinierten Modelle des Dokument Intelligenz-Diensts oder die von Ihnen trainierten Modelle beschriften.

    Animierter Screenshot: automatische Beschriftung in Studio

  • Bei einigen Dokumenten liegen nach der automatischen Beschriftung möglicherweise einige Beschriftungen doppelt vor. Stellen Sie sicher, dass Sie die Beschriftungen so ändern, dass auf der Beschriftungsseite keine doppelten Beschriftungen vorhanden sind.

    Screenshot: Warnung zu doppelter Beschriftung nach automatischer Beschriftung

Automatisches Bezeichnen von Tabellen

  • Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie jetzt die Tabellen im Dokument automatisch beschriften. Eine manuelle Beschriftung ist nicht erforderlich.

    Animierter Screenshot: automatische Tabellenbeschriftung in Studio

Direktes Hinzufügen von Testdateien zu Ihrem Trainingsdataset

  • Wenn Sie ein benutzerdefiniertes Extraktionsmodell trainieren, verbessern Sie die Modellqualität über die Testseite, indem Sie bei Bedarf Testdokumente in das Trainingsdataset hochladen.

  • Wenn für einige Beschriftungen eine niedrige Konfidenzbewertung zurückgegeben wird, vergewissern Sie sich, dass Ihre Inhalte korrekt beschriftet sind. Fügen Sie sie andernfalls dem Trainingsdataset hinzu, und beschriften Sie sie neu, um die Modellqualität zu verbessern.

    Animierter Screenshot: Hinzufügen von Testdateien zum Trainingsdataset

Verwenden der Dokumentlistenoptionen und -filter in benutzerdefinierten Projekten

  • Verwenden Sie die Beschriftungsseite des benutzerdefinierten Extraktionsmodells, um mühelos durch Ihre Schulungsdokumente zu navigieren, indem Sie die Such-, Filter- und Sortierfeatures verwenden.

  • Verwenden Sie die Rasteransicht, um Dokumente in der Vorschau anzuzeigen, oder verwenden Sie die Listenansicht, um einfacher durch die Dokumente zu scrollen.

    Screenshot: Optionen und Filter der Dokumentlistenansicht

Projektfreigabe

Geben Sie mühelos benutzerdefinierte Extraktionsprojekte frei. Weitere Informationen finden Sie unter Projektfreigabe mit benutzerdefinierten Modellen.

Nächste Schritte

Erste Schritte mit dem Dokument Intelligenz-Studio.