Delen via


Een aangepast generatief model bouwen en trainen met AI Studio

In dit artikel leert u hoe u een aangepast generatief model bouwt en traint met Azure AI Studio. Aangepaste modellen voor Document Intelligence vereisen slechts vijf trainingsdocumenten om aan de slag te gaan. Hebt u ten minste vijf documenten? Zo ja, dan gaan we aan de slag met het trainen en testen van het aangepaste generatieve model.

Vereisten

  • Een Azure-abonnement. Als u geen Azure-abonnement hebt, kunt u er gratis een maken.

  • Zodra u uw Azure-abonnement een Document Intelligence-exemplaar hebt in Azure Portal. U kunt de gratis prijscategorie (F0) gebruiken om de service te proberen.

  • Nadat uw resource is geïmplementeerd, selecteert u Ga naar de resource en haalt u uw sleutel en eindpunt op.

    • U hebt de sleutel en het eindpunt van de resource nodig om uw toepassing te verbinden met de Document Intelligence-service. U plakt uw sleutel en eindpunt verderop in de code in de quickstart. U vindt deze waarden op de pagina Sleutels en eindpunten van Azure Portal.

Autorisatie van opslagcontainers

U kunt een van de volgende opties kiezen om toegang tot uw documentresource te autoriseren.

✔️ Beheerde identiteit. Een beheerde identiteit is een service-principal waarmee een Microsoft Entra-identiteit en specifieke machtigingen voor een door Azure beheerde resource worden gemaakt. Met beheerde identiteiten kunt u uw Document Intelligence-toepassing uitvoeren zonder referenties in uw code in te sluiten. Beheerde identiteiten zijn een veiligere manier om toegang te verlenen tot opslaggegevens en om de vereiste voor het opnemen van sas-tokens (Shared Access Signature) te vervangen door uw bron- en resultaat-URL's.

Zie Beheerde identiteiten voor Document Intelligence voor meer informatie.

Schermopname van de stroom van beheerde identiteiten (op rollen gebaseerd toegangsbeheer).

Belangrijk

  • Wanneer u beheerde identiteiten gebruikt, neemt u geen SAS-token-URL op met uw HTTP-aanvragen. Uw aanvragen mislukken. Als u beheerde identiteiten gebruikt, wordt de vereiste voor het opnemen van sas-tokens (Shared Access Signature) vervangen. ✔️ Shared Access Signature (SAS). Een handtekening voor gedeelde toegang is een URL die gedurende een opgegeven periode beperkte toegang verleent aan uw Document Intelligence-service. Als u deze methode wilt gebruiken, moet u SAS-tokens (Shared Access Signature) maken voor uw bron- en resultaatcontainers. De bron- en resultaatcontainers moeten een SAS-token (Shared Access Signature) bevatten, toegevoegd als een querytekenreeks. Het token kan worden toegewezen aan uw container of specifieke blobs.

Schermopname van opslag-URI met een SAS-token toegevoegd.

  • Uw broncontainer of blob moet lees-, schrijf-, lijst- en verwijdertoegang aanwijzen.
  • Uw resultaatcontainer of blob moet schrijf-, lijst- en verwijdertoegang aanwijzen.

Zie SAS-tokens maken voor meer informatie.

Trainingsgegevens

Volg deze tips om uw gegevensset te optimaliseren voor training:

  • Gebruik pdf-documenten op basis van tekst in plaats van op afbeeldingen gebaseerde documenten. Gescande PDF-bestanden worden verwerkt als afbeeldingen.

  • Gebruik voorbeelden met alle velden die zijn ingevuld voor formulieren met invoervelden.

  • Gebruik in formulieren met in elk veld verschillende waarden.

  • gebruik een grotere gegevensset (10-15 afbeeldingen) als uw formulierafbeeldingen van lagere kwaliteit zijn.

Zodra u uw Azure Blob Storage-containers hebt, uploadt u uw trainingsgegevens naar uw broncontainers. Nu bent u klaar om uw aangepaste generatieve model te trainen.

Azure AI Studio

  1. Navigeer naar Azure AI Studio. De eerste keer dat u Studio gebruikt, moet u uw abonnement initialiseren en een hub maken voordat u een project maakt. Aangepaste generatieve modellen zijn alleen beschikbaar in VS - oost en VS - noord-centraal in preview. Zorg ervoor dat uw resourcegroep is ingesteld op VS - oost of VS - noord-centraal tijdens het maken van de hub.

  2. Selecteer de tegel Vision + Document.

    Schermopname van de tegel Document intelligence/vision.

  3. Selecteer vervolgens de tegel Documentveldextractie en selecteer de projectknop Documentveldextractie maken om een project te maken.

    Schermopname van de projectpagina documentveldextractie maken.

  4. Maak uw project. Zie Een project maken in Azure AI Studio voor meer informatie.

  5. Maak een Azure AI-servicesverbinding voor toegang tot de Azure Document Intelligence-service:

    Schermopname van de overzichtspagina documentextractieproject maken.

  6. Selecteer vervolgens het opslagaccount dat u hebt gebruikt om uw aangepaste modeltrainingsgegevensset te uploaden.

    Schermopname van de pagina met projectgegevensinstellingen voor documentextractie.

  7. Controleer de projectinstellingen en selecteer Create a Project deze om een nieuw project te maken. Zodra u het project hebt geselecteerd, moet u zich nu in het Define schema venster bevinden en de bestanden in de vermelde gegevensset zien.

Het schema definiëren

  • Voor uw project is de eerste taak het toevoegen van de velden om een schema te extraheren en te definiëren.

  • De bestanden die u hebt geüpload, worden weergegeven en u kunt de vervolgkeuzelijst gebruiken om bestanden te selecteren. U kunt velden toevoegen door op de ➕ Add new field knop te klikken.

  • Voer een naam, beschrijving en type in voor het veld dat moet worden geëxtraheerd. Zodra alle velden zijn toegevoegd, selecteert u de Save knop onder aan het scherm.

Labelgegevens

  • Zodra het schema is opgeslagen, worden alle geüploade trainingsdocumenten geanalyseerd en worden veldwaarden automatisch geëxtraheerd. Veldwaarden worden weergegeven op het scherm voor revisie. De automatisch geëxtextracteerde velden worden gelabeld als Voorspeld.

  • Controleer de voorspelde waarden. Als de veldwaarde onjuist is of niet is geëxtraheerd, kunt u de muisaanwijzer op het voorspelde veld bewegen. Selecteer de knop Bewerken om de wijzigingen aan te brengen:

    Schermopname van de knop Voor het bewerken van het extractieproject.

  • Zodra de wijziging is aangebracht, wordt het voorspelde label weergegeven Corrected:

    Schermopname van de indicator voor het corrigeren van het extractieproject.

  • Ga door met het controleren van de voorspelde velden. Nadat de labels zijn gecontroleerd en gecorrigeerd voor alle trainingsdocumenten, gaat u verder met het bouwen van uw model.

    Notitie

    U kunt altijd teruggaan en het schema bijwerken tijdens de modeltraining, maar als u de functie voor automatisch label wilt gebruiken, moet u de bestanden verwijderen en opnieuw laden met behulp van Upload files de optie.

Uw model bouwen

Nu uw gegevensset is gelabeld, bent u klaar om uw model te trainen. Selecteer de Build model. Geef op de dialoogvensterpagina Build model een unieke modelnaam en eventueel een beschrijving op. De model-id accepteert een gegevenstype tekenreeks.

Schermopname van de pagina een extractiemodel maken.

Selecteer Build deze optie om het trainingsproces te starten. Generatieve modellen trainen direct! Vernieuw de pagina om het model te selecteren zodra de status is gewijzigd.

Uw model testen

  • Zodra de modeltraining is voltooid, kunt u uw model testen door op de pagina CustomAtive de knop te selecteren Test .

    Schermopname van de aangepaste generatieve pagina.

  • Upload uw testbestanden en selecteer Run Analysis deze om veldwaarden uit de documenten te extraheren. Met de Analyze optie kunt u ervoor kiezen om het huidige document of alle documenten uit te voeren en te analyseren.

  • Valideer de nauwkeurigheid van uw model door de resultaten voor elk veld te evalueren.

Dat is het! U hebt geleerd om een aangepast generatief model te trainen in Azure AI Studio. Uw model is klaar voor gebruik met de REST API of de SDK om documenten te analyseren.

Volgende stappen

Meer informatie over het aangepaste generatieve model

Meer informatie over nauwkeurigheid en betrouwbaarheid van aangepaste modellen