Redigera

Dela via


Anpassade dokumentbearbetningsmodeller i Azure

Azure AI-dokumentinformation
Azure AI services
Azure Logic Apps
Azure Machine Learning Studio
Azure Storage

Den här artikeln beskriver Azure-lösningar för att skapa, träna, distribuera och använda anpassade modeller för dokumentbearbetning. Dessa Azure-tjänster erbjuder även användargränssnittsfunktioner (UI) för etikettering eller taggning för textbearbetning.

Arkitektur

Arkitekturdiagram som visar flera alternativ för en modellversion och distributionsprocess för anpassad dokumentbearbetningsmodell.

Ladda ned en Visio-fil med den här arkitekturen.

Dataflöde

  1. Orkestrerare som Azure Logic Apps, Azure Data Factory eller Azure Functions matar in meddelanden och bifogade filer från e-postservrar och filer från FTP-servrar eller webbprogram.

    • Azure Functions och Logic Apps aktiverar serverlösa arbetsbelastningar. Vilken tjänst du väljer beror på vad du föredrar för tjänstfunktioner som utveckling, anslutningsappar, hantering och körningskontext. Mer information finns i Jämför Azure Functions och Azure Logic Apps.

    • Överväg att använda Azure Data Factory för massflytt av data.

  2. Orkestrarna skickar inmatade data till Azure Blob Storage eller Data Lake Storage och organiserar data mellan datalager baserat på egenskaper som filtillägg eller kunder.

  3. De olika tjänster som kan användas för att träna dokument och skapa anpassade modeller i Azure oberoende av varandra eller i olika kombinationer för att hantera olika användningsfall är:

    • Document Intelligence Studio: Om dokumentet kräver att du extraherar nyckel/värde-par eller skapar en anpassad tabell från ett bildformat eller PDF använder du Document Intelligence Studio för att tagga data och träna den anpassade modellen. Om det finns ett krav på att identifiera typen av dokument (dokumentklassificering) innan du anropar rätt extraheringsmodell använder du Document Intelligent Studio för att märka dokumenten och skapa modellerna.

    • Language Studio: För dokumentklassificering baserat på innehåll, eller för domänspecifik entitetsextrahering, kan du träna en anpassad textklassificerings- eller NER-modell (Named Entity Recognition) i Language Studio.

    • Azure Machine Learning Studio: Om du vill märka data för textklassificering eller entitetsextrahering som du kan använda med ramverk med öppen källkod som PyTorch eller TensorFlow använder du Machine Learning Studio eller Python SDK, Azure CLI eller REST API. Azure Machine Learning-studio tillhandahåller en modellkatalog med grundmodeller. Dessa grundmodeller har finjusteringsfunktioner för olika uppgifter som textklassificering, frågesvar, sammanfattning osv. Om du vill finjustera grundmodeller använder du Machine Learning Studio UI eller kod.

    • Azure OpenAI Service: För finjustering av Azure OpenAI-modeller på dina egna data eller domäner för olika uppgifter som textsammanfattning, frågesvar använder du [Azure AI Foundry Portal]((https://ai.azure.com/) eller Python SDK eller REST API.

  4. Så här distribuerar du de anpassade modellerna och använder dem för slutsatsdragning:

    • Azure AI Document Intelligence har inbyggd modelldistribution. Använd SDK:er för dokumentinformation eller REST-API :et för att tillämpa anpassade modeller för slutsatsdragning. Inkludera modell-ID :t eller det anpassade modellnamnet i URL:en för dokumentinformationsbegäran, beroende på API-versionen. Dokumentinformation kräver inga ytterligare distributionssteg.

    • Language Studio tillhandahåller ett alternativ för att distribuera anpassade språkmodeller. Hämta URL:en för förutsägelse av REST-slutpunkter genom att välja den modell som ska distribueras. Du kan utföra modellinferenser med hjälp av REST-slutpunkten eller Azure SDK-klientbiblioteken.

    • Machine Learning distribuerar anpassade modeller till online- eller batchhanterade Slutpunkter för Machine Learning. Du kan också använda Machine Learning SDK för att distribuera till Azure Kubernetes Service (AKS) som en webbtjänst. Finjusterade grundmodeller distribueras från modellkatalogen på två sätt: Hanterad beräkning och Serverlöst API. Modeller som distribueras via hanterad beräkning kan härledas med hjälp av hanterade slutpunkter – onlineslutpunkter för slutsatsdragning i realtid och batchslutpunkter för batchinferens.

    • Azure AI Foundry ger möjlighet att distribuera den finstämda Azure OpenAI-modellen. Du kan också distribuera finetuned Azure OpenAI-modeller med Hjälp av Python SDK eller REST API.

Komponenter

  • Logic Apps är en del av Azure Integration Services. Logic Apps skapar automatiserade arbetsflöden som integrerar appar, data, tjänster och system. Med hanterade anslutningsappar för tjänster som Azure Storage och Microsoft 365 kan du utlösa arbetsflöden när en fil hamnar i lagringskontot eller e-postmeddelandet tas emot.

  • Data Factory är en ETL-tjänst (managed cloud extract, transform, load) för dataintegrering och transformering. Data Factory kan lägga till transformeringsaktiviteter i en pipeline som omfattar att anropa en REST-slutpunkt eller köra en notebook-fil på inmatade data.

  • Azure Functions är en serverlös beräkningstjänst som kan vara värd för händelsedrivna arbetsbelastningar med kortvariga processer.

  • Blob Storage är objektlagringslösningen för rådatafiler i det här scenariot. Blob Storage stöder bibliotek för flera språk, till exempel .NET, Node.js och Python. Program kan komma åt filer på Blob Storage via HTTP/HTTPS. Blob Storage har frekventa, lågfrekventa och arkiverade åtkomstnivåer som stöd för kostnadsoptimering för lagring av stora mängder data.

  • Data Lake Storage är en uppsättning funktioner som bygger på Azure Blob Storage för stordataanalys. Data Lake Storage behåller kostnadseffektiviteten för Blob Storage och tillhandahåller funktioner som säkerhet på filnivå och filsystemssemantik med hierarkiskt namnområde.

  • Dokumentinformation är en del av Azure AI-tjänster. Dokumentinformation har inbyggda funktioner för dokumentanalys som du kan använda för att extrahera tryckt och handskriven text, tabeller och nyckel/värde-par. Document Intelligence har fördefinierade modeller för att extrahera data från fakturor, dokument, kvitton, ID-kort och visitkort. Dokumentinformation har också en anpassad mallformulärmodell och en anpassad neural dokumentmodell som du kan använda för att träna och distribuera anpassade modeller.

    • Document Intelligence Studio tillhandahåller ett användargränssnitt som du kan använda för att utforska funktioner och modeller för dokumentinformation och för att skapa, tagga, träna och distribuera anpassade modeller.
  • Azure AI Language konsoliderar bearbetningstjänsterna för naturligt språk i Azure. Sviten erbjuder fördefinierade och anpassningsbara alternativ. Mer information finns i tillgängliga funktioner för Azure AI Language.

    • Language Studio tillhandahåller ett användargränssnitt för att utforska och analysera Azure AI Language-funktioner. Language Studio innehåller även alternativ för att skapa, tagga, träna och distribuera anpassade modeller.
  • Azure Machine Learning är en hanterad maskininlärningsplattform för modellutveckling och distribution i stor skala.

    • Azure Machine Learning-studio innehåller alternativ för dataetiketter för bilder och text.
    • Exportera märkta data som COCO - eller Azure Machine Learning-datamängder. Du kan använda datauppsättningarna för att träna och distribuera modeller i Azure Machine Learning-notebook-filer.
  • Azure OpenAI Service erbjuder kraftfulla språkmodeller, multimodala modeller som REST-API:er som används för att utföra olika uppgifter. Vissa av de modeller som erbjuds kan också finjusteras för att förbättra modellprestanda för data som inte fanns eller underrepresenterades när basmodellen ursprungligen tränades.

Alternativ

Du kan lägga till fler arbetsflöden i det här scenariot baserat på specifika användningsfall.

  • Om dokumentet är i bild- eller PDF-format kan du extrahera data med hjälp av Azure-visuellt innehåll, läs-API för dokumentinformation eller bibliotek med öppen källkod.

  • Du kan göra dokument- och konversationssammanfattningar med hjälp av den fördefinierade modellen i Azure AI Language.

  • Använd förbearbetningskod för att utföra textbearbetningssteg. De här stegen omfattar rensning, borttagning av stoppord, lemmatisering, härstamning och textsammanfattning för extraherade data enligt kraven för dokumentbearbetning. Du kan exponera koden som REST-API:er för automatisering. Utför dessa steg manuellt eller automatisera dem genom att integrera med logic apps - eller Azure Functions-inmatningsprocessen .

  • Du kan använda Azure AI Foundry-portalen för att finjustera, distribuera grundmodeller (förutom Azure OpenAI-modeller) och skapa generativa AI-program.

    Eftersom det finns vissa överlappningar mellan Azure Machine Learning och Azure AI Foundry måste du utvärdera deras funktioner och välja den bästa plattformen för ditt scenario.

  • Du kan också använda Azure AI Content Understanding- för att skapa en anpassad analysator genom att definiera ett fältschema för att extrahera strukturerade data från dokumentet.

Information om scenario

Dokumentbearbetning är ett brett område. Det kan vara svårt att uppfylla alla dina dokumentbearbetningsbehov med de fördefinierade modellerna som är tillgängliga i Document Intelligence och Azure AI Language. Du kan behöva skapa anpassade modeller för att automatisera dokumentbearbetningen för olika program och domäner.

Här är några av de största utmaningarna med modellanpassning:

  • Etikettera eller tagga textdata med relevanta nyckel/värde-parentiteter för att klassificera text för extrahering.
  • Hantera utbildningsinfrastruktur som beräkning och lagring och deras integreringar.
  • Distribuera modeller på ett säkert sätt i stor skala för enkel integrering med användning av program.

Potentiella användningsfall

Följande användningsfall kan dra nytta av anpassade modeller för dokumentbearbetning:

  • Skapa anpassade NER- och textklassificeringsmodeller baserat på ramverk med öppen källkod.
  • Extrahera anpassade nyckelvärden från dokument för olika branschvertaler som försäkring och sjukvård.
  • Tagga och extrahera specifika domänberoende entiteter utöver de fördefinierade NER-modellerna för domäner som säkerhet eller ekonomi.
  • Skapa anpassade tabeller från dokument.
  • Extrahera signaturer.
  • Märka och klassificera e-postmeddelanden eller andra dokument baserat på innehåll.
  • Dokumentsammanfattning eller anpassad fråga och svar på dina data.

Att tänka på

Dessa överväganden implementerar grundpelarna i Azure Well-Architected Framework, som är en uppsättning vägledande grundsatser som kan användas för att förbättra kvaliteten på en arbetsbelastning. Mer information finns i Microsoft Azure Well-Architected Framework.

För den här exempelarbetsbelastningen beror implementeringen av varje pelare på optimal konfigurering och användning av varje komponent i Azure-tjänsten.

Tillförlitlighet

Tillförlitlighet säkerställer att ditt program kan uppfylla de åtaganden du gör gentemot dina kunder. Mer information finns i Checklista för designgranskning för tillförlitlighet.

Tillgänglighet

Motståndskraft

Säkerhet

Säkerhet ger garantier mot avsiktliga attacker och missbruk av dina värdefulla data och system. Mer information finns i Checklista för designgranskning för säkerhet.

Kostnadsoptimering

Kostnadsoptimering handlar om att titta på sätt att minska onödiga utgifter och förbättra drifteffektiviteten. Mer information finns i Checklista för designgranskning för kostnadsoptimering.

Den totala kostnaden för att implementera den här lösningen beror på prissättningen för de tjänster du väljer.

De största kostnaderna för den här lösningen är:

Mer information om priser för specifika komponenter finns i följande resurser:

Använd priskalkylatorn för Azure för att lägga till dina valda komponentalternativ och beräkna den totala lösningens kostnad.

Prestandaeffektivitet

Prestandaeffektivitet är arbetsbelastningens förmåga att skala för att uppfylla användarnas krav på ett effektivt sätt. Mer information finns i Checklista för designgranskning för prestandaeffektivitet.

Skalbarhet

  • Om du vill skala Azure Functions automatiskt eller manuellt väljer du rätt värdplan.

  • Dokumentinformation stöder 15 samtidiga begäranden per sekund som standard. Om du vill begära en ökad kvot skapar du en Azure Support biljett.

  • För anpassade Azure Machine Learning-modeller som hanteras som webbtjänster på AKS azureml-fe skalas klientdelen automatiskt efter behov. Den här komponenten dirigerar även inkommande slutsatsdragningsbegäranden till distribuerade tjänster.

  • För distributioner som hanterade slutpunkter stöder du automatisk skalning genom att integrera med autoskalningsfunktionen i Azure Monitor.

  • API-tjänstens gränser för anpassad NER - och anpassad textklassificering för slutsatsdragning är 20 GET- eller POST-begäranden per minut.

Deltagare

Den här artikeln underhålls av Microsoft. Den skrevs ursprungligen av följande deltagare.

Huvudförfattare:

Om du vill se icke-offentliga LinkedIn-profiler loggar du in på LinkedIn.

Nästa steg