Kom igång med anpassade projekt i Document Intelligence Studio
Det här innehållet gäller för: v4.0 (GA) | Tidigare versioner: v3.1 (GA) v3.0 (GA)
Document Intelligence Studio är ett onlineverktyg för att visuellt utforska, förstå och integrera funktioner från document intelligence-tjänsten i dina program. Den här snabbstarten syftar till att ge dig en guide för att konfigurera ett anpassat projekt i Document Intelligence Studio.
Förutsättningar för nya användare
Se följande dokumentation för att skapa prenumerationer och resurser samt autentiseringskonfiguration.
Ytterligare förutsättningar för anpassade projekt
Förutom Azure-kontot och en dokumentinformations- eller Azure AI-tjänstresurs behöver du:
Azure Blob Storage-container
Ett Azure Blob Storage-konto med standardprestanda. Du skapar containrar för att lagra och organisera dina träningsdokument i ditt lagringskonto. Om du inte vet hur du skapar ett Azure-lagringskonto med en container följer du dessa snabbstarter:
- Skapa ett lagringskonto. När du skapar ditt lagringskonto måste du välja Standardprestanda i fältet Instansinformation → Prestanda .
- Skapa en container. När du skapar containern anger du fältet Offentlig åtkomstnivå till Container (anonym läsåtkomst för containrar och blobar) i fönstret Ny container .
Azure-rolltilldelningar
För anpassade projekt krävs följande rolltilldelningar för olika scenarier.
Grundläggande
- Cognitive Services-användare: Du behöver den här rollen för dokumentintelligens eller Azure AI-tjänstresurs för att träna den anpassade modellen eller göra analyser med tränade modeller.
- Storage Blob Data-deltagare: Du behöver den här rollen för lagringskontot för att skapa ett projekt och etikettdata.
Avancerad
- Lagringskontodeltagare: Du behöver den här rollen för att lagringskontot ska kunna konfigurera CORS-inställningar (den här åtgärden är en engångsåtgärd om samma lagringskonto återanvänds).
- Deltagare: Du behöver den här rollen för att skapa en resursgrupp och resurser.
Kommentar
Om lokal (nyckelbaserad) autentisering är inaktiverad för dokumentinformationstjänstens resurs och lagringskonto måste du skaffa roller för Cognitive Services-användare respektive Lagringsblobdatadeltagare , så att du har tillräckligt med behörighet för att använda Document Intelligence Studio. Rollerna Deltagare och Deltagare för lagringskonto tillåter bara att du listar nycklar, men du får inte behörighet att använda resurserna när nyckelåtkomst är inaktiverat.
Konfigurera CORS
CORS (Cross Origin Resource Sharing) måste konfigureras på ditt Azure-lagringskonto för att det ska vara tillgängligt från Document Intelligence Studio. För att konfigurera CORS i Azure Portal behöver du åtkomst till cors-fliken för ditt lagringskonto.
Välj fliken CORS för lagringskontot.
Börja med att skapa en ny CORS-post i Blob-tjänsten.
Ange Tillåtna ursprung till
https://documentintelligence.ai.azure.com
.Dricks
Du kan använda jokertecknet *i stället för en angiven domän för att tillåta att alla ursprungsdomäner gör begäranden via CORS.
Välj alla tillgängliga 8 alternativ för Tillåtna metoder.
Godkänn alla tillåtna rubriker och synliga rubriker genom att ange en * i varje fält.
Ange Maxålder till 120 sekunder eller ett acceptabelt värde.
Spara ändringarna genom att välja knappen Spara överst på sidan.
CORS bör nu konfigureras för att använda lagringskontot från Document Intelligence Studio.
Exempeldokumentuppsättning
Logga in på Azure Portal och gå till Lagringskontots>datalagringscontainrar>.
Välj en container i listan.
Välj Ladda upp på menyn överst på sidan.
Fönstret Ladda upp blob visas.
Välj dina filer som ska laddas upp.
Kommentar
Som standard använder Studio dokument som finns i containerns rot. Du kan dock använda data ordnade i mappar genom att ange mappsökvägen i stegen för att skapa anpassade formulärprojekt. Se Ordna dina data i undermappar
Använda Funktionerna i Document Intelligence Studio
Etikettera dokument automatiskt med fördefinierade modeller eller en av dina egna modeller
På sidan för anpassad extraheringsmodelletikett kan du nu automatiskt märka dina dokument med någon av de fördefinierade modellerna i Document Intelligent Service eller dina tränade modeller.
För vissa dokument är duplicerade etiketter möjliga när autoetiketten har körts. Se till att ändra etiketterna så att det inte finns några dubblettetiketter på etikettsidan efteråt.
Tabeller för automatisk etikett
På sidan för anpassad extraheringsmodelletikett kan du nu automatiskt märka tabellerna i dokumentet utan att behöva märka tabellerna manuellt.
Lägga till testfiler direkt i din träningsdatauppsättning
När du har tränat en anpassad extraheringsmodell använder du testsidan för att förbättra modellkvaliteten genom att ladda upp testdokument till träningsdatauppsättningen om det behövs.
Om en låg konfidenspoäng returneras för vissa etiketter ska du se till att etikettera innehållet korrekt. Om inte lägger du till dem i träningsdatauppsättningen och ometiketter för att förbättra modellkvaliteten.
Använd alternativen och filtren för dokumentlistan i anpassade projekt
Använd den anpassade sidan för extraheringsmodelletiketter för att enkelt navigera genom dina träningsdokument genom att använda sökningen, filtret och sorteringsfunktionen.
Använd rutnätsvyn för att förhandsgranska dokument eller använda listvyn för att rulla igenom dokumenten enklare.
Projektdelning
Dela anpassade extraheringsprojekt med lätthet. Mer information finns i Projektdelning med anpassade modeller.
Nästa steg
- Följ migreringsguiden för Document Intelligence v3.1 för att lära dig skillnaderna från den tidigare versionen av REST-API:et.
- Utforska våra V4.0 SDK-snabbstarter för att prova v3.0-funktionerna i dina program med hjälp av de nya klientbiblioteken.
- Se våra rest-API-snabbstarter för v4.0 för att prova v3.0-funktionerna med hjälp av det nya REST-API:et.