Erste Schritte: Dokument Intelligenz-Studio
Dieser Inhalt gilt für: Version 4.0 (Vorschau) | Frühere Versionen: Version 3.1 (GA) Version 3.0 (GA)
Dokument Intelligenz-Studio ist ein Onlinetool für das visuelle Erkunden, Verstehen und Integrieren der Features des Dokument Intelligenz-Diensts in Ihre Anwendungen. Sie können loslegen, indem Sie die vortrainierten Modelle mit Beispieldokumenten oder Ihren eigenen Dokumenten erkunden. Sie können auch Projekte für die Entwicklung von benutzerdefinierten Vorlagenmodellen erstellen und in Ihren Anwendungen darauf verweisen, indem Sie die Informationen zum Python SDK und andere Schnellstartanleitungen verwenden.
Voraussetzungen für neue Benutzer
Um Dokument Intelligenz-Studio zu verwenden, benötigen Sie folgende Ressourcen und Einstellungen:
Ein aktives Azure-Konto. Falls Sie noch kein Konto haben, können Sie ein kostenloses Konto erstellen.
Eine Dokument Intelligenz-Ressource oder eine Ressource für mehrere Dienste.
Tipp
Erstellen Sie eine Azure KI Services-Ressource, wenn Sie planen, auf mehrere Azure KI Services unter einem einzelnen Endpunkt/Schlüssel zuzugreifen. Erstellen Sie nur für den Zugriff auf Dokument Intelligenz eine Dokument Intelligenz-Ressource. Beachten Sie, dass Sie eine Einzeldienstressource benötigen, wenn Sie die Microsoft Entra-Authentifizierung verwenden möchten.
Dokument Intelligenz unterstützt jetzt beim Zugriff auf die Ressourcen und die Speicherkonten von Dokument Intelligenz zusätzlich zur lokalen (schlüsselbasierten) Authentifizierung die AAD-Tokenauthentifizierung. Befolgen Sie die folgenden Anweisungen, um die richtigen Zugriffsrollen einzurichten – insbesondere dann, wenn Ihre Ressourcen mit der DisableLocalAuth
-Richtlinie angewendet werden.
Azure-Rollenzuweisungen mit korrektem Bereich Für Dokumentanalysemodelle und vordefinierte Modelle sind die folgenden Rollenzuweisungen für verschiedene Szenarien erforderlich.
Basic ✔️ Cognitive Services-Benutzer: Sie benötigen diese Rolle für Dokument Intelligenz- oder Azure KI Services-Ressourcen, um die Analyseseite aufzurufen.
Advanced ✔️ Mitwirkender: Sie benötigen diese Rolle zum Erstellen einer Ressourcengruppe, eines Dokument Intelligenz-Diensts oder einer Azure KI Services-Ressource.
Weitere Informationen zur Autorisierung finden Sie in den Autorisierungsrichtlinien von Dokument Intelligenz Studio.
Hinweis
Wenn die lokale (schlüsselbasiert) Authentifizierung für Ihre Dokument Intelligenz-Dienstressource deaktiviert ist, müssen Sie die Rolle Cognitive Services-Benutzer erhalten, und Ihr AAD-Token wird zum Authentifizieren von Anforderungen in Dokument Intelligenz Studio verwendet. Die Rolle Mitwirkender ermöglicht Ihnen lediglich das Auflisten von Schlüsseln. Sie erteilt Ihnen jedoch nicht die Berechtigung, die Ressource zu verwenden, wenn der Schlüsselzugriff deaktiviert ist.
Nachdem Ihre Ressource konfiguriert wurde, können Sie die verschiedenen Modelle ausprobieren, die von Dokument Intelligenz Studio angeboten werden. Wählen Sie auf der Startseite ein beliebiges Dokument Intelligenz-Modell aus, um es ohne Code zu verwenden.
Um eines der Dokumentanalyse- oder vordefinierten Modelle zu testen, wählen Sie das Modell aus, und verwenden Sie eines der Beispieldokumente, oder laden Sie Ihr eigenes Dokument hoch, um es zu analysieren. Das Analyseergebnis wird rechts im Inhaltsergebniscodefenster angezeigt.
Benutzerdefinierte Modelle müssen mit Ihren Dokumenten trainiert werden. Eine Übersicht über benutzerdefinierte Modelle finden Sie in Übersicht über benutzerdefinierte Modelle.
Authentifizierung
Navigieren Sie zu Dokument Intelligenz-Studio. Wenn Sie sich zum ersten Mal anmelden, wird ein Popupfenster angezeigt, in dem Sie auffordert werden, Ihre Dienstressource zu konfigurieren. Gemäß der Richtlinie Ihrer Organisation haben Sie eine oder zwei Optionen:
Microsoft Entra-Authentifizierung: Zugriff nach Resource (empfohlen).
Wählen Sie Ihr bestehendes Abonnement aus.
Wählen Sie eine bestehende Ressourcengruppe innerhalb Ihres Abonnements aus, oder erstellen Sie eine neue Gruppe.
Wählen Sie Ihre vorhandene Dokument Intelligenz- oder Azure KI Services-Ressource aus.
Lokale Authentifizierung: Zugriff nach API-Endpunkt und Schlüssel.
Rufen Sie Ihren Endpunkt und Schlüssel im Azure-Portal ab.
Wechseln Sie zur Übersichtsseite für Ihre Ressource, und wählen Sie in der linken Navigationsleiste Schlüssel und Endpunkt aus.
Geben Sie die Werte in die entsprechenden Felder ein.
Nachdem Sie das Szenario in Document Intelligence Studio überprüft haben, verwenden Sie die Clientbibliotheken von C#, Java, JavaScript oder Python oder die REST-API, um mit der Integration von Dokument Intelligenz-Modellen in Ihre eigenen Anwendungen zu beginnen.
Weitere Informationen zu den einzelnen Modellen finden Sie auf den Konzeptseiten.
Anzeigen von Ressourcendetails
Zum Anzeigen von Ressourcendetails wie Name und Tarif klicken Sie auf das Symbol Einstellungen in der oberen rechten Ecke der Startseite von Dokument Intelligenz-Studio und wählen Sie die Registerkarte Ressource aus. Wenn Sie Zugriff auf andere Ressourcen haben, können Sie auch die Ressourcen wechseln.
Hinzugefügte Voraussetzungen für benutzerdefinierte Projekte
Zusätzlich zum Azure-Konto und einer Dokument Intelligenz- oder Azure KI Services-Ressource benötigen Sie Folgendes:
Azure Blob Storage-Container
Ein Azure Blob Storage-Konto mit Standardleistung. Sie erstellen Container zum Speichern und Organisieren Ihrer Trainingsdokumente unter Ihrem Speicherkonto. Wenn Sie nicht wissen, wie Sie ein Azure Speicherkonto mit einem Container erstellen können, befolgen Sie diese Schnellstarts:
- Informationen zu Azure-Speicherkonten Stellen Sie bei der Erstellung Ihres Speicherkontos sicher, dass Sie Leistung Standard im Feld Instanzdetails -> Leistung auswählen.
- Erstellen Sie einen Container. Stellen Sie bei der Erstellung Ihres Containers das Feld Öffentliche Zugriffsebene auf Container(anonymer Lesezugriff für Container und Blobs) im dem Fenster Neuer Container.
Azure-Rollenzuweisungen
Für benutzerdefinierte Projekte sind die folgenden Rollenzuweisungen für verschiedene Szenarien erforderlich:
Grundlegend
- Cognitive Services-Benutzer: Sie benötigen diese Rolle für Dokument Intelligenz- oder Azure KI Services-Ressourcen, um das benutzerdefinierte Modell zu trainieren oder Analysen mit trainierten Modellen durchzuführen.
- Mitwirkender an Storage-Blobdaten: Sie benötigen diese Rolle für das Speicherkonto, um ein Projekt zu erstellen und Daten zu beschriften.
Erweitert
- Speicherkontomitwirkender: Sie benötigen diese Rolle für das Speicherkonto, um CORS-Einstellungen einzurichten (diese Aktion muss nur einmal ausgeführt werden, wenn dasselbe Speicherkonto wiederverwendet wird).
- Mitwirkender: Sie benötigen diese Rolle, um eine Ressourcengruppe und Ressourcen zu erstellen.
Hinweis
Wenn die lokale (schlüsselbasierte) Authentifizierung für Ihr Dokument Intelligenz-Dienstressourcen- und Speicherkonto deaktiviert ist, müssen Sie die Rollen Cognitive Services-Benutzer bzw. Storage Blob-Datenmitwirkender abrufen, sodass Sie über ausreichende Berechtigungen zum Verwenden von Dokument Intelligenz-Studio verfügen. Die Rollen Speicherkontomitwirkender und Mitwirkender erlauben Ihnen nur das Auflisten von Schlüsseln, geben Ihnen aber nicht das Recht, die Ressourcen zu verwenden, wenn der Schlüsselzugriff deaktiviert ist.
Konfigurieren von CORS
Für Ihr Azure-Speicherkonto muss CORS (Cross Origin Resource Sharing) konfiguriert sein, damit es über das Dokument Intelligenz-Studio zugänglich ist. Zum Konfigurieren von CORS im Azure-Portal benötigen Sie Zugriff auf die Registerkarte „CORS“ Ihres Speicherkontos.
Wählen Sie die Registerkarte „CORS“ für das Speicherkonto aus.
Erstellen Sie zunächst einen neuen CORS-Eintrag im Blob-Dienst.
Setzen Sie die Erlaubten Ursprünge auf
https://documentintelligence.ai.azure.com
.Tipp
Sie können anstelle der Domäne auch das Platzhalterzeichen „*“ verwenden, um allen Ursprungsdomänen die Ausführung von CORS-Anforderungen zu erlauben.
Wählen Sie für Zulässige Methoden alle verfügbaren acht Optionen aus.
Genehmigen Sie die Angaben für Zulässige Header und Verfügbar gemachte Header, indem Sie in jedes Feld ein Sternchen (*) eingeben.
Legen Sie für Max. Alter 120 Sekunden oder einen anderen gültigen Wert ein.
Wählen Sie oben auf der Seite die Schaltfläche „Speichern“ aus, um die Änderungen zu speichern.
CORS sollte jetzt für die Verwendung des Speicherkontos über Dokument Intelligenz-Studio konfiguriert sein.
Gruppe von Beispieldokumenten
Melden Sie sich beim Azure-Portal an, und navigieren Sie zu Ihr Speicherkonto>Datenspeicher>Container.
Wählen Sie einen Container aus der Liste aus.
Wählen Sie Hochladen aus dem Menü am oberen Rand der Seite.
Das Fenster Blob hochladen wird angezeigt.
Wählen Sie Ihre Dateien zum Hochladen aus.
Hinweis
Standardmäßig verwendet Studio Dokumente, die sich im Stammverzeichnis Ihres Containers befinden. Sie können aber auch Daten verwenden, die in Ordnern angeordnet sind, indem Sie den Pfad zum Ordner in den Schritten zum Erstellen des Projekts für benutzerdefinierte Formulare angeben. Siehe Organisieren Sie Ihre Daten in Unterordnern
Verwenden von Dokument Intelligenz Studio-Features
Automatische Beschriftung von Dokumenten mit vordefinierten Modellen oder einem Ihrer eigenen Modelle
Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie Ihre Dokumente jetzt automatisch anhand eines der vordefinierten Modelle des Dokument Intelligenz-Diensts oder die von Ihnen trainierten Modelle beschriften.
Bei einigen Dokumenten liegen nach der automatischen Beschriftung möglicherweise einige Beschriftungen doppelt vor. Stellen Sie sicher, dass Sie die Beschriftungen so ändern, dass auf der Beschriftungsseite keine doppelten Beschriftungen vorhanden sind.
Automatisches Bezeichnen von Tabellen
Auf der Beschriftungsseite des benutzerdefinierten Extraktionsmodells können Sie jetzt die Tabellen im Dokument automatisch beschriften. Eine manuelle Beschriftung ist nicht erforderlich.
Direktes Hinzufügen von Testdateien zu Ihrem Trainingsdataset
Wenn Sie ein benutzerdefiniertes Extraktionsmodell trainieren, verbessern Sie die Modellqualität über die Testseite, indem Sie bei Bedarf Testdokumente in das Trainingsdataset hochladen.
Wenn für einige Beschriftungen eine niedrige Konfidenzbewertung zurückgegeben wird, vergewissern Sie sich, dass Ihre Inhalte korrekt beschriftet sind. Fügen Sie sie andernfalls dem Trainingsdataset hinzu, und beschriften Sie sie neu, um die Modellqualität zu verbessern.
Verwenden der Dokumentlistenoptionen und -filter in benutzerdefinierten Projekten
Verwenden Sie die Beschriftungsseite des benutzerdefinierten Extraktionsmodells, um mühelos durch Ihre Schulungsdokumente zu navigieren, indem Sie die Such-, Filter- und Sortierfeatures verwenden.
Verwenden Sie die Rasteransicht, um Dokumente in der Vorschau anzuzeigen, oder verwenden Sie die Listenansicht, um einfacher durch die Dokumente zu scrollen.
Projektfreigabe
Geben Sie mühelos benutzerdefinierte Extraktionsprojekte frei. Weitere Informationen finden Sie unter Projektfreigabe mit benutzerdefinierten Modellen.
Nächste Schritte
- Folgen Sie unserer Migrationsanleitung zu Dokument Intelligenz v3.1, um die Unterschiede zur vorherigen Version der REST-API kennenzulernen.
- Erkunden Sie die Schnellstarts für das SDK von v4.0, um die Features von v3.0 in Ihren Anwendungen mithilfe der neuen Clientbibliotheken auszuprobieren.
- Sehen Sie sich unsere Schnellstartanleitungen zur REST-API für v4.0 an, um die Funktionen von v3.0 mithilfe der neuen REST-API auszuprobieren.