Det här innehållet gäller för: v4.0 (förhandsversion) v3.1 (GA) v3.0 (GA) v2.1 (GA)
Azure AI Document Intelligence är en molnbaserad tjänst som använder maskininlärningsmodeller för att extrahera nyckel/värde-par, text och tabeller från dina dokument. Det returnerade resultatet är en strukturerad JSON-utdata. Användningsfall för dokumentinformation omfattar automatiserad databehandling, förbättrade datadrivna strategier och utökade funktioner för dokumentsökning.
Översikt
Är Azure AI Document Intelligence och Azure AI Formigenkänning samma tjänst?
Ja.
Azure AI Document Intelligence och Azure AI Formigenkänning är samma tjänst. Tjänsten bytte namn från Azure AI Formigenkänning till Azure AI Document Intelligence i juli 2023. Tjänsten har samma funktioner och funktioner som före namnbytet.
Prisändringar: Det finns inga ändringar i prissättningen. Namnen Cognitive Services och Applied AI Services fortsätter att användas i Azure-fakturering, kostnadsanalys, prislistor och pris-API:er.
Icke-bakåtkompatibla ändringar: Det finns inga icke-bakåtkompatibla ändringar i API:er eller klientbibliotek. REST API:er och SDK-versioner 2024-02-29-preview, 2023-10-31-preview och senare byter
document intelligence
namn på .
Integrerar Dokumentinformation med andra Microsoft-tjänster?
Ja.
Dokumentinformation integreras med följande tjänster:
AI-funktioner
Kan jag använda Dokumentinformation med generativ AI för dokumentbearbetning?
Ja.
Dokumentinformation innehåller nu anpassad generativ en ny typ av extraheringsmodell som använder Generativ AI och stora språkmodeller (LLM) för att extrahera fält från dokument. Tidigare använde du ett RAG-mönster (hämtningsförhöjd generering) för att extrahera fält. Den nya modellen ger högkvalitativa resultat med ett enda API-anrop. Du kan också använda en dokumentgenererande AI-lösning för att chatta med dina dokument (RAG), generera fängslande innehåll från dessa dokument och få åtkomst till Azure OpenAI Service-modeller på dina data.
Med Azure AI Document Intelligence och Azure OpenAI tillsammans kan du skapa ett företagsprogram som smidigt interagerar med dina dokument med naturligt språk. Du kan enkelt hitta svar, få värdefulla insikter och generera nytt och engagerande innehåll från befintliga dokument.
Du hittar mer information om hämtningsmönstret för utökad generering här.
Kan dokumentinformation hjälpa till med semantisk segmentering i dokument för hämtning av utökad generering?
Ja.
Dokumentinformation kan tillhandahålla byggstenarna för att aktivera semantisk segmentering. Semantisk segmentering är ett viktigt steg i hämtningsförhöjd generering (RAG) för att säkerställa kontexttäta segment och relevansförbättringar.
Dokumentinformation tillhandahåller en layoutmodell som ger en visuell nedbrytning av dokumentet i rader, stycken, avsnitt, sidhuvuden och sidfötter.
Du kan sedan välja att hämta resultaten i markdown-format för att ytterligare segmenta dokumentet på avsnitts- eller styckegränser.
Mer information finns i översikten över RAG i Dokumentinformation
Document Intelligence Studio
Behöver jag specifika behörigheter för att få åtkomst till Document Intelligence Studio?
Ja.
Du behöver ett aktivt Azure-konto och en prenumeration med minst en läsarroll för att få åtkomst till Document Intelligence Studio.
Här är rollkraven för användarscenarier för dokumentanalys och fördefinierade modeller:
Grundläggande
- Cognitive Services-användare: Du behöver den här rollen för en dokumentintelligens eller azure cognitive services-resurs med flera tjänster för att kunna använda Document Intelligence Studio.
Avancerad
- Deltagare: Du behöver den här rollen för att skapa en resursgrupp eller en dokumentinformationsresurs.
Här är rollkraven för användarscenarier för anpassade modellprojekt:
Grundläggande
Cognitive Services-användare: Du behöver den här rollen för en dokumentintelligens eller cognitive services-resurs med flera tjänster för att träna en anpassad modell eller analysera med tränade modeller.
Storage Blob Data-deltagare: Du behöver den här rollen för ett lagringskonto för att skapa projekt- och etikettdata.
Avancerad
Lagringskontodeltagare: Du behöver den här rollen för lagringskontot för att konfigurera CORS-inställningar (cross-origin resource sharing). Det är en engångsinsats om du återanvänder samma lagringskonto.
Deltagare: Du behöver den här rollen för att skapa en resursgrupp och resurser. Rollen Deltagare eller Lagringskontodeltagare ger dig inte åtkomst till att använda dokumentinformationsresursen eller lagringskontot om lokal (nyckelbaserad) autentisering är inaktiverad. Du behöver fortfarande de grundläggande rollerna (Cognitive Services-användare och Storage Data Blob-deltagare) för att använda funktionerna i Document Intelligence Studio.
Mer information finns i Inbyggda Microsoft Entra-roller och avsnitten om Azure-rolltilldelningar i snabbstarten för Document Intelligence Studio.
Kan jag bearbeta dokument med fler än två sidor i Document Intelligence Studio?
Ja, för resurser på betald nivå.
Nej, för resurser på den kostnadsfria nivån.
För resurser på den kostnadsfria nivån (F0) analyseras endast de två första sidorna oavsett om du använder Document Intelligence Studio, REST API eller klientbibliotek.
Om du vill analysera alla sidor i ett dokument ändrar du till en betald resurs (S0). I Document Intelligence Studio väljer du knappen Inställningar (kugghjul), väljer fliken Resurser och kontrollerar prisnivån som ska användas för att analysera dina dokument.
Kan jag ändra kataloger eller prenumerationer i Document Intelligence Studio?
Ja.
Om du vill ändra en katalog i Document Intelligence Studio väljer du knappen Inställningar (kugghjul). Under Katalog väljer du katalogen i listan och väljer sedan Växla katalog. Logga in igen när du har bytt katalog.
Om du vill ändra en prenumeration eller resurs går du till fliken Resurs under Inställningar.
Kan jag använda Document Intelligence Studio med en resurs som har konfigurerats med en brandvägg eller ett virtuellt nätverk?
Ja.
Om dokumentinformationsresursen har konfigurerats med en brandvägg eller ett virtuellt nätverk måste du lägga till den dedikerade IP-adressen 20.3.165.95 i brandväggens tillåtna lista för dokumentinformationsresursen. Vissa funktioner i anpassade projekt (till exempel autolabel, projekthantering och människa i loopen) fungerar inte om den offentliga nätverksåtkomsten är inaktiverad.
Kan jag använda en URL från min bloblagring när jag laddar upp en fil i Document Intelligence Studio med funktionen Hämta från URL?
Ja.
Om azure-bloblagrings-URL:en innehåller en SAS-token och är tillgänglig från offentliga nätverk. Du kan inte använda funktionen Hämta för lagringskonton där nyckelåtkomsten är inaktiverad eller bakom en brandvägg/ett virtuellt nätverk.
Kan jag återanvända eller anpassa etiketteringsupplevelsen från Document Intelligence Studio och bygga in den i mitt eget program?
Ja.
Etiketteringsupplevelsen från Document Intelligence Studio öppen källkod d i Toolkit-lagringsplatsen.
Finns det separata URL-slutpunkter för nationella molnregioner i Document Intelligence?
Ja.
Document Intelligence Studio har separata URL-slutpunkter för nationella molnregioner:
URL för Azure US Government-molnet (Azure Fairfax): Document Intelligence Studio US Government.
URL Microsoft Azure som drivs av 21Vianet (Azure China): Document Intelligence Studio China.
Apputveckling
Kan jag utveckla program med hjälp av Azure AI Document Intelligence med hjälp av de senaste utvecklingsalternativen?
Ja.
Document Intelligence erbjuder de senaste utvecklingsalternativen på följande plattformar:
[REST API](/rest/api/aiservices/document-models/analyze-document?view=rest-aiservices-2023-07-31 &preserve-view=true&tabs=HTTP)
Kan jag migrera mitt program till den senaste versionen av Dokumentinformation?
Ja.
Följande tabell innehåller länkar till detaljerade instruktioner för migrering till den senaste versionen av Dokumentinformation:
Språk/API | Migreringsguide |
---|---|
REST-API | v3 |
C#/.NET | 4.0.0 |
Java | 4.0.0 |
JavaScript | 4.0.0 |
Python | 3.2.0 |
Kan jag ange ett intervall med sidor som ska analyseras i ett dokument?
Ja.
Använd parametern pages
(stöds i v2.1, v3.0 och senare versioner av REST-API:et) och ange sidor för PDF- och TIFF-dokument med flera sidor. Godkända indata innehåller följande intervall:
- Enkla sidor. Om du till exempel anger
1, 2
bearbetas sidorna 1 och 2. - Ändliga intervall. Om du till exempel anger
2-5
bearbetas sidorna 2 till 5. - Intervall med öppen slutpunkt. Om du till exempel anger
5-
bearbetas alla sidor från sidan 5. Om du anger-10
bearbetas sidorna 1 till 10.
Du kan blanda dessa parametrar och intervall kan överlappa varandra. Om du till exempel anger -5, 1, 3, 5-10
bearbetas sidorna 1 till 10.
Tjänsten godkänner begäran om den kan bearbeta minst en sida i dokumentet. Att till exempel använda 5-100
på ett femsidigt dokument är en giltig indata som innebär att sidan 5 bearbetas.
Om du inte anger något sidintervall bearbetas hela dokumentet.
Rekommenderar du att du använder Document Intelligence Studio i stället för FOTT-exempeletikettverktyget för mitt projekt?
Ja.
Vi rekommenderar Document Intelligence Studio för det mesta eftersom det kan minska din tid för att konfigurera dokumentinformationsresurser och lagringstjänster.
Överväg endast att använda FOTT (Form Testing Tool) för följande scenarier:
Dina data måste finnas kvar på en enda dator. Använd FOTT-exempeletikettverktyget och en dokumentinformationscontainer.
Ditt projekt är starkt beroende av Document Intelligence V2.1 och du vill fortsätta använda v2.1-API:erna.
Finns det metodtips för att minska begränsningen?
Ja.
Dokumentinformation använder automatisk skalning för att tillhandahålla nödvändiga beräkningsresurser på begäran, samtidigt som kundkostnaderna hålls låga. För att minska begränsningen under autoskalning rekommenderar vi följande metod:
Implementera logik för omprövning i ditt program.
Om du upptäcker att du begränsas av antalet
POST
begäranden kan du överväga att lägga till en fördröjning mellan begäranden.Öka arbetsbelastningen gradvis. Undvik skarpa ändringar.
Skapa en supportbegäran för att öka gränsen för transaktioner per sekund (TPS).
Läs mer om kvoter och gränser för Document Intelligence-tjänsten.
Anpassade modeller
Kan jag förbättra en uppskattad noggrannhetspoäng för en anpassad modell?
Ja.
Avvikelser i den visuella strukturen i dina dokument kan påverka en modells noggrannhet. Här följer några tips:
Inkludera alla varianter av ett dokument i träningsdatauppsättningen. Varianter inkluderar olika format; till exempel digitala jämfört med skannade PDF-filer.
Separera visuellt distinkta dokumenttyper och träna olika modeller.
Kontrollera att du inte har överflödiga etiketter.
För signatur- och regionsetiketter ska du inte inkludera den omgivande texten.
Mer information finns i Noggrannhets- och konfidenspoäng.
Kan jag träna om en anpassad modell?
Nej.
Dokumentinformation har ingen explicit omträningsåtgärd. Varje tågåtgärd genererar en ny modell.
Om du upptäcker att din modell behöver tränas om kan du lägga till fler exempel i din träningsdatauppsättning och träna en ny modell.
Du kan också skapa en ny modell för att skapa med din ursprungliga modell på följande sätt:
Skapa en datauppsättning för den nya mallen.
Märk och träna en ny modell.
Kontrollera att den nya modellen fungerar bra för dina specifika dokumenttyper.
Skapa din nya modell med den befintliga modellen till en enda slutpunkt. Dokumentinformation kan sedan fastställa den bästa modellen för varje dokument som ska analyseras.
Mer information finns i sammansatta modeller.
Kan jag flytta mina tränade modeller från en miljö (till exempel beta) till en annan (som produktion)?
Ja.
Du kan använda API:et Kopiera för att kopiera anpassade modeller från ett dokumentinformationskonto till andra som finns i valfri geografisk region som stöds. Detaljerade instruktioner finns i Haveriberedskap.
Kopieringsåtgärden är begränsad till att kopiera modeller i den specifika molnmiljö där du har tränat modellen. Till exempel stöds inte kopiering av modeller från det offentliga molnet till Azure Government-molnet.
Debiteras jag när jag tränar en anpassad modell?
Ja.
Träning är kostnadsfri för alla anpassade generativa och anpassade mallmodeller. Att skapa träningsdatauppsättningen för alla modeller kräver dock att du kör layoutmodellen i träningsdokumenten. Kunderna ansvarar för den här kostnaden.
Anpassade generativa modeller förlitar sig också på funktionen för automatisk etikett för att påskynda genereringen av den märkta datamängden. Det finns en kostnad som är kopplad till den här åtgärden. Även om byggåtgärden för mallar och generativa modeller är kostnadsfri kan skapandet av den märkta datamängden resultera i några minimala kostnader.
För v4.0 2024-07-31-preview
kan anpassade neurala modeller tränas kostnadsfritt i högst 10 timmar. Oavsett om du tränar en enskild modell under de 10 timmarna eller tränar flera modeller för totalt 10 timmar debiteras du inte under de första 10 timmarna. När du har använt de kostnadsfria 10 timmarna debiteras du automatiskt av den extra träningstimmesen. Mer information om priserna finns på sidan med priser. Den här nya funktionen för betald utbildning gör det möjligt för träningsmodeller under en längre tid att bearbeta större dokument. Mer information om den här betalda träningsfunktionen finns i avsnittet om fakturering av anpassade neurala modeller.
För v3.0 2022-08-31
eller v3.1 2023-07-31
kan anpassade neurala modeller tränas kostnadsfritt under högst 20 träningspass, där varje session är begränsad till 30 minuters träningsvaraktighet. När du har använt alla de 20 utbildningssessionerna kan du skicka in Azure Support biljett för att öka utbildningsgränsen. För att öka gränsen betraktas två träningspass som en träningstimmes och du debiteras per två sessioner/en träningstimmes. Mer information om priserna finns på sidan [prissättning]. Mer information om hur du ökar gränsen finns i avsnittet om fakturering av anpassade neurala modeller. För v3.0
och v3.1
är funktionen för betald utbildning inte tillgänglig. Funktionen betald träning för anpassad neural modell är endast tillgänglig på v4.0
.
Lagringskonto
Finns det en förfallotid för sas-token (signatur för delad åtkomst) som jag har för mitt lagringskontoautentisering?
Ja.
När du skapar en signatur för delad åtkomst (SAS) är standardvaraktigheten 48 timmar. Efter 48 timmar måste du skapa en ny token.
Överväg att ange en längre varaktighetsperiod för den tid som du använder ditt lagringskonto med Dokumentinformation.
Kan dokumentinformation komma åt data i mitt lagringskonto om det finns bakom ett virtuellt nätverk eller en brandvägg?
Nej, inte direkt.
Dokumentinformation kan inte komma åt ditt lagringskonto om det skyddas av ett virtuellt nätverk eller en brandvägg.
Åtkomst och autentisering för privata Azure Storage-konton stöder dock hanterade identiteter för Azure-resurser. När du använder en hanterad identitet kan document intelligence-tjänsten komma åt ditt lagringskonto med hjälp av en tilldelad autentiseringsuppgift.
Om du tänker analysera dina privata lagringskontodata med hjälp av FOTT måste du distribuera verktyget bakom det virtuella nätverket eller brandväggen.
Lär dig hur du skapar och använder en hanterad identitet för din dokumentinformationsresurs.
Containers
Finns det någon skillnad mellan frånkopplade och anslutna containrar?
Ja.
Även om modellfunktionerna är desamma för anslutna och frånkopplade containrar skiljer sig fakturerings- och anslutningsmetoderna åt:
Anslutna containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Med anslutna containrar krävs internetanslutning för att skicka faktureringsinformation till Azure. Dokumentinformationsanslutna containrar skickar faktureringsinformation till Azure med hjälp av en dokumentinformationsresurs på ditt Azure-konto. Anslutna containrar skickar inte kunddata, till exempel den bild eller text som analyseras, till Microsoft. Ett exempel på den information som anslutna containrar skickar till Microsoft för fakturering finns i Vanliga frågor och svar om Azure AI-container.
Med frånkopplade containrar kan du använda API:er som är frånkopplade från Internet. Faktureringsinformation skickas inte via Internet. Avgifter baseras i stället på en inköpt åtagandenivå. För närvarande är frånkopplad containeranvändning tillgänglig för anpassade dokumentinformations- och fakturamodeller.
Kan jag använda lokal lagring för FOTT-containern (Document Intelligence Sample Labeling Tool) ?
Ja.
FOTT har en version som använder lokal lagring. Versionen måste installeras på en Windows-dator. Du kan installera den från den här platsen.
På projektsidan anger du etikettmappens URI som /shared eller /shared/sub-dir om etiketteringsfilerna finns i en underkatalog. Alla andra beteenden för exempeletiketteringsverktyget för dokumentinformation är samma som den värdbaserade tjänsten.
Finns det bästa praxis för att skala upp?
Ja.
För asynkrona anrop kan du köra flera containrar med delad lagring. Containern som bearbetar analysanropet POST
lagrar utdata i lagringen. Sedan kan alla andra containrar hämta resultatet från lagringen och hantera anropen GET
. Begärande-ID:t är inte kopplat till en container.
För synkrona anrop kan du köra flera containrar, men bara en container hanterar en begäran. Eftersom det är ett blockerande anrop kan alla containrar från poolen hantera begäran och skicka svaret. Här är endast en container kopplad till en begäran i taget och ingen avsökning krävs.
Kan jag konfigurera containrar med delad lagring?
Ja.
Containrarna använder Mounts: Shared
egenskapen när de startas för att ange det delade lagringsutrymmet för att lagra bearbetningsfilerna. Information om hur du använder den här egenskapen finns i dokumentationen för containrar.
Säkerhet och sekretess
Lagrar Dokumentinformation mina data?
Ja, kortfattat.
För alla funktioner lagrar Document Intelligence tillfälligt data och resultat i Azure Storage i samma region som begäran. Dina data tas sedan bort inom 24 timmar från den tidpunkt då du skickar en analysbegäran.
Läs mer om data, sekretess och säkerhet för dokumentinformation.
För tränade anpassade modeller lagras interimutdata efter analys och etikettering på samma Azure Storage-plats där du lagrar dina träningsdata. De tränade anpassade modellerna lagras i Azure Storage i samma region och är logiskt isolerade med din Azure-prenumeration och DINA API-autentiseringsuppgifter.
Mer hjälp och support
Finns det andra resurser tillgängliga för att tillhandahålla lösningar på frågor om Azure AI Document Intelligence?
Ja.
Microsoft Q &A är hem för tekniska frågor och svar på Microsoft. Du kan filtrera frågor som är specifika för dokumentinformation.
Kan jag ge direkt feedback om tjänsten inte känner igen specifik text eller identifierar den felaktigt när jag etiketterar dokument?
Ja.
Vi uppdaterar och förbättrar kontinuerligt modellerna för dokumentinformation. Du kan skicka ett e-postmeddelande till dokumentinformationsteamet. Om möjligt kan du dela ett exempeldokument med problemet markerat.