Een aangepast generatief model bouwen en trainen met AI Studio
In dit artikel leert u hoe u een aangepast generatief model bouwt en traint met Azure AI Studio. Aangepaste modellen voor Document Intelligence vereisen slechts vijf trainingsdocumenten om aan de slag te gaan. Hebt u ten minste vijf documenten? Zo ja, dan gaan we aan de slag met het trainen en testen van het aangepaste generatieve model.
Vereisten
Een Azure-abonnement. Als u geen Azure-abonnement hebt, kunt u er gratis een maken.
Zodra u uw Azure-abonnement een Document Intelligence-exemplaar hebt in Azure Portal. U kunt de gratis prijscategorie (
F0
) gebruiken om de service te proberen.Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource en haalt u uw sleutel en eindpunt op.
- U hebt de sleutel en het eindpunt van de resource nodig om uw toepassing te verbinden met de Document Intelligence-service. U plakt uw sleutel en eindpunt verderop in de code in de quickstart. U vindt deze waarden op de pagina Sleutels en eindpunten van Azure Portal.
Autorisatie van opslagcontainers
U kunt een van de volgende opties kiezen om toegang tot uw documentresource te autoriseren.
✔️ Beheerde identiteit. Een beheerde identiteit is een service-principal waarmee een Microsoft Entra-identiteit en specifieke machtigingen voor een door Azure beheerde resource worden gemaakt. Met beheerde identiteiten kunt u uw Document Intelligence-toepassing uitvoeren zonder referenties in uw code in te sluiten. Beheerde identiteiten zijn een veiligere manier om toegang te verlenen tot opslaggegevens en om de vereiste voor het opnemen van sas-tokens (Shared Access Signature) te vervangen door uw bron- en resultaat-URL's.
Zie Beheerde identiteiten voor Document Intelligence voor meer informatie.
Belangrijk
- Wanneer u beheerde identiteiten gebruikt, neemt u geen SAS-token-URL op met uw HTTP-aanvragen. Uw aanvragen mislukken. Als u beheerde identiteiten gebruikt, wordt de vereiste voor het opnemen van sas-tokens (Shared Access Signature) vervangen. ✔️ Shared Access Signature (SAS). Een handtekening voor gedeelde toegang is een URL die gedurende een opgegeven periode beperkte toegang verleent aan uw Document Intelligence-service. Als u deze methode wilt gebruiken, moet u SAS-tokens (Shared Access Signature) maken voor uw bron- en resultaatcontainers. De bron- en resultaatcontainers moeten een SAS-token (Shared Access Signature) bevatten, toegevoegd als een querytekenreeks. Het token kan worden toegewezen aan uw container of specifieke blobs.
- Uw broncontainer of blob moet lees-, schrijf-, lijst- en verwijdertoegang aanwijzen.
- Uw resultaatcontainer of blob moet schrijf-, lijst- en verwijdertoegang aanwijzen.
Zie SAS-tokens maken voor meer informatie.
Trainingsgegevens
Volg deze tips om uw gegevensset te optimaliseren voor training:
Gebruik pdf-documenten op basis van tekst in plaats van op afbeeldingen gebaseerde documenten. Gescande PDF-bestanden worden verwerkt als afbeeldingen.
Gebruik voorbeelden met alle velden die zijn ingevuld voor formulieren met invoervelden.
Gebruik in formulieren met in elk veld verschillende waarden.
gebruik een grotere gegevensset (10-15 afbeeldingen) als uw formulierafbeeldingen van lagere kwaliteit zijn.
Zodra u uw Azure Blob Storage-containers hebt, uploadt u uw trainingsgegevens naar uw broncontainers. Nu bent u klaar om uw aangepaste generatieve model te trainen.
Azure AI Studio
Navigeer naar Azure AI Studio. De eerste keer dat u Studio gebruikt, moet u uw abonnement initialiseren en een hub maken voordat u een project maakt. Aangepaste generatieve modellen zijn alleen beschikbaar in VS - oost en VS - noord-centraal in preview. Zorg ervoor dat uw resourcegroep is ingesteld op VS - oost of VS - noord-centraal tijdens het maken van de hub.
Selecteer de tegel Vision + Document.
Selecteer vervolgens de tegel Documentveldextractie en selecteer de projectknop Documentveldextractie maken om een project te maken.
Maak uw project. Zie Een project maken in Azure AI Studio voor meer informatie.
Maak een Azure AI-servicesverbinding voor toegang tot de Azure Document Intelligence-service:
Selecteer vervolgens het opslagaccount dat u hebt gebruikt om uw aangepaste modeltrainingsgegevensset te uploaden.
Controleer de projectinstellingen en selecteer
Create a Project
deze om een nieuw project te maken. Zodra u het project hebt geselecteerd, moet u zich nu in hetDefine schema
venster bevinden en de bestanden in de vermelde gegevensset zien.
Het schema definiëren
Voor uw project is de eerste taak het toevoegen van de velden om een schema te extraheren en te definiëren.
De bestanden die u hebt geüpload, worden weergegeven en u kunt de vervolgkeuzelijst gebruiken om bestanden te selecteren. U kunt velden toevoegen door op de
➕ Add new field
knop te klikken.Voer een naam, beschrijving en type in voor het veld dat moet worden geëxtraheerd. Zodra alle velden zijn toegevoegd, selecteert u de
Save
knop onder aan het scherm.
Labelgegevens
Zodra het schema is opgeslagen, worden alle geüploade trainingsdocumenten geanalyseerd en worden veldwaarden automatisch geëxtraheerd. Veldwaarden worden weergegeven op het scherm voor revisie. De automatisch geëxtextracteerde velden worden gelabeld als Voorspeld.
Controleer de voorspelde waarden. Als de veldwaarde onjuist is of niet is geëxtraheerd, kunt u de muisaanwijzer op het voorspelde veld bewegen. Selecteer de knop Bewerken om de wijzigingen aan te brengen:
Zodra de wijziging is aangebracht, wordt het voorspelde label weergegeven
Corrected
:Ga door met het controleren van de voorspelde velden. Nadat de labels zijn gecontroleerd en gecorrigeerd voor alle trainingsdocumenten, gaat u verder met het bouwen van uw model.
Notitie
U kunt altijd teruggaan en het schema bijwerken tijdens de modeltraining, maar als u de functie voor automatisch label wilt gebruiken, moet u de bestanden verwijderen en opnieuw laden met behulp van
Upload files
de optie.
Uw model bouwen
Nu uw gegevensset is gelabeld, bent u klaar om uw model te trainen. Selecteer de Build model
. Geef op de dialoogvensterpagina Build model een unieke modelnaam en eventueel een beschrijving op. De model-id accepteert een gegevenstype tekenreeks.
Selecteer Build
deze optie om het trainingsproces te starten. Generatieve modellen trainen direct! Vernieuw de pagina om het model te selecteren zodra de status is gewijzigd.
Uw model testen
Zodra de modeltraining is voltooid, kunt u uw model testen door op de pagina CustomAtive de knop te selecteren
Test
.Upload uw testbestanden en selecteer
Run Analysis
deze om veldwaarden uit de documenten te extraheren. Met deAnalyze
optie kunt u ervoor kiezen om het huidige document of alle documenten uit te voeren en te analyseren.Valideer de nauwkeurigheid van uw model door de resultaten voor elk veld te evalueren.
Dat is het! U hebt geleerd om een aangepast generatief model te trainen in Azure AI Studio. Uw model is klaar voor gebruik met de REST API of de SDK om documenten te analyseren.
Volgende stappen
Meer informatie over het aangepaste generatieve model
Meer informatie over nauwkeurigheid en betrouwbaarheid van aangepaste modellen