Delen via


Quickstart: Aangepaste categorieën (standaardmodus) (preview)

Volg deze handleiding om aangepaste categorieën (standaard) voor Azure AI Content Safety te gebruiken om uw eigen inhoudscategorieën voor uw use-case te maken en Azure AI Content Safety te trainen om deze te detecteren in nieuwe tekstinhoud.

Zie de conceptpagina Aangepaste categorieën voor meer informatie over aangepaste categorieën. Zie de sectie Invoervereisten van het overzicht voor API-invoerlimieten.

Belangrijk

Deze functie is alleen beschikbaar in bepaalde Azure-regio's. Zie beschikbaarheid van regio's.

Belangrijk

Voldoende tijd toestaan voor modeltraining

De end-to-end uitvoering van aangepaste categorietraining kan van ongeveer vijf uur tot tien uur duren. Plan uw beheerpijplijn dienovereenkomstig.

Vereisten

  • Een Azure-abonnement - Een gratis abonnement maken
  • Zodra u uw Azure-abonnement hebt, maakt u een Content Safety-resource in Azure Portal om uw sleutel en eindpunt op te halen. Voer een unieke naam in voor uw resource, selecteer uw abonnement en selecteer een resourcegroep, ondersteunde regio en ondersteunde prijscategorie. Selecteer vervolgens Maken.
    • Het implementeren van de resource duurt enkele minuten. Nadat deze is voltooid, gaat u naar de resource. Selecteer in het linkerdeelvenster onder Resourcebeheer de optie Abonnementssleutel en Eindpunt. Kopieer het eindpunt en een van de sleutelwaarden naar een tijdelijke locatie voor later gebruik.
  • Maak ook een Azure Blob Storage-container waarin u uw trainingsaantekeningsbestand bewaart.
  • Een van de volgende geïnstalleerd:

Uw trainingsgegevens voorbereiden

Als u een aangepaste categorie wilt trainen, hebt u voorbeeldtekstgegevens nodig die de categorie vertegenwoordigen die u wilt detecteren. In deze handleiding kunt u voorbeeldgegevens gebruiken. Het verstrekte aantekeningsbestand bevat tekstprompts over overlevingsadvies in camping-/wildernissituaties. Het getrainde model leert dit type inhoud in nieuwe tekstgegevens te detecteren.

Tip

Zie de handleiding instructies voor tips over het maken van uw eigen gegevensset.

  1. Download het voorbeeldgegevensbestand van de GitHub-opslagplaats.
  2. Upload het JSONL-bestand naar de blobcontainer van uw Azure Storage-account. Kopieer vervolgens de blob-URL naar een tijdelijke locatie voor later gebruik.

Belangrijk

Het opslagaccount van de gebruiker is ingesteld als een hiërarchisch naamruimteaccount, dat niet kan worden ondersteund door aangepaste categorieën. Probeer in plaats daarvan een normaal opslagaccount te gebruiken. Uw blob-URL kan bijvoorbeeld niet worden gesplitst in twee lagen, zoals voorbeeld/voorbeeld1/, en mag slechts één laag hebben. Raadpleeg de documentatie voor meer informatie: Hiërarchische naamruimte van Azure Data Lake Storage - Azure Storage.

Opslagtoegang verlenen

Vervolgens moet u uw Content Safety-resource toegang geven om te lezen uit de Azure Storage-resource. Schakel door het systeem toegewezen beheerde identiteit in voor het Azure AI Content Safety-exemplaar en wijs de rol van Inzender/Eigenaar voor opslagblobgegevens toe aan de identiteit:

Belangrijk

Alleen inzender voor opslagblobgegevens of eigenaar van opslagblobgegevens zijn geldige rollen om door te gaan.

  1. Schakel beheerde identiteit in voor het Azure AI Content Safety-exemplaar.

    Schermopname van Het inschakelen van een beheerde identiteit in Azure Portal.

  2. Wijs de rol van Inzender/Eigenaar voor opslagblobgegevens toe aan de beheerde identiteit. Alle rollen die hieronder zijn gemarkeerd, moeten werken.

    Schermopname van het scherm Roltoewijzing toevoegen in Azure Portal.

    Schermopname van toegewezen rollen in Azure Portal.

    Schermopname van de rol beheerde identiteit.

Een aangepaste categorie maken en trainen

Vervang <your_api_key>in de onderstaande opdracht en <your_endpoint>andere benodigde parameters door uw eigen waarden. Voer vervolgens elke opdracht in een terminalvenster in en voer deze uit.

Nieuwe categorieversie maken

curl -X PUT "<your_endpoint>/contentsafety/text/categories/<your_category_name>?api-version=2024-09-15-preview" \
     -H "Ocp-Apim-Subscription-Key: <your_api_key>" \
     -H "Content-Type: application/json" \
     -d "{
            \"categoryName\": \"survival-advice\",
            \"definition\": \"text prompts about survival advice in camping/wilderness situations\",
            \"sampleBlobUrl\": \"https://<your-azure-storage-url>/example-container/survival-advice.jsonl\"
        }"

Tip

Telkens wanneer u de categorienaam, definitie of voorbeelden wijzigt, wordt er een nieuwe versie gemaakt. U kunt het versienummer gebruiken om terug te gaan naar eerdere versies. Onthoud dit versienummer, omdat dit vereist is in de URL voor de volgende stap: aangepaste categorieën trainen.

API-aanvraag

Veld Beschrijving Voorbeeldwaarde
categoryName De naam van de categorie of het onderwerp waarop de aanvraag betrekking heeft. overlevingsadvies
definition Een korte beschrijving van het inhoudstype voor de categorie. tekstprompts over overlevingsadvies in camping-/wildernissituaties
sampleBlobUrl URL voor toegang tot een JSONL-voorbeeldbestand met gegevensvoorbeelden voor de categorie. Koppeling

API-reactie

Veld Beschrijving Voorbeeldwaarde
categoryName De naam van de categorie of het onderwerp waarop het antwoord betrekking heeft. overlevingsadvies
definition Een korte beschrijving van het inhoudstype voor de categorie. tekstprompts over overlevingsadvies in camping-/wildernissituaties
sampleBlobUrl URL voor toegang tot een JSONL-voorbeeldbestand met gegevensvoorbeelden voor de categorie. Koppeling
sampleBlobSnapshotUrl Momentopname-URL van het JSONL-voorbeeldbestand, dat toegang biedt tot een specifieke versie van de gegevens. Momentopname-URL
version Het versienummer van de categoriegegevens. 1
createdTime Tijdstempel wanneer de categoriegegevens zijn gemaakt. 2024-10-28T22:06:59.4626988Z
status Huidige status van de categoriegegevensverwerking. Geslaagd

Start het buildproces van de categorie:

Vervang <your_api_key> en <your_endpoint> door uw eigen waarden en voeg ook het versienummer toe aan de URL die u hebt verkregen uit de laatste stap. Voldoende tijd voor modeltraining toestaan: de end-to-end uitvoering van aangepaste categorietraining kan van ongeveer vijf uur tot tien uur duren. Plan uw beheerpijplijn dienovereenkomstig. Nadat u het antwoord hebt ontvangen, slaat u de bewerkings-id (aangeduid als id) op een tijdelijke locatie op. Deze id is nodig voor het ophalen van de buildstatus met behulp van de GET-status-API in de volgende sectie.

curl -X POST "<your_endpoint>/contentsafety/text/categories/survival-advice:build?api-version=2024-09-15-preview&version={version}" \
     -H "Ocp-Apim-Subscription-Key: <your_api_key>" \
     -H "Content-Type: application/json"

API-reactie

Veld Beschrijving Voorbeeldwaarde
operation id Unieke id voor het ophalen van de buildstatus b6c69dc1-2338-484e-85a5b-xxxxxxxxxxxxxx
status Huidige status van de aanvraag Geslaagd

De buildstatus van de categorie ophalen:

Als u de status wilt ophalen, gebruikt u het id verkregen uit het vorige API-antwoord en plaatst u deze in het pad van de onderstaande API.

curl -X GET "<your_endpoint>/contentsafety/text/categories/operations/<id>?api-version=2024-09-15-preview" \
     -H "Ocp-Apim-Subscription-Key: <your_api_key>" \
     -H "Content-Type: application/json"

API-reactie

Veld Beschrijving Voorbeeldwaarde
operation id Unieke id voor het ophalen van de buildstatus b6c69dc1-2338-484e-855b-xxxxxxxxxxxx
status Huidige status van de aanvraag Geslaagd

Tekst analyseren met een aangepaste categorie

Voer de volgende opdracht uit om tekst te analyseren met uw aangepaste categorie. Vervang <your_api_key> en <your_endpoint> door uw eigen waarden.

curl -X POST "<your_endpoint>/contentsafety/text:analyzeCustomCategory?api-version=2024-09-15-preview" \
     -H "Ocp-Apim-Subscription-Key: <your_api_key>" \
     -H "Content-Type: application/json" \
     -d "{
            \"text\": \"<Example text to analyze>\",
            \"categoryName\": \"survival-advice\", 
            \"version\": 1
        }"

API-aanvraag

Veld Beschrijving
text De tekstinhoud of het bericht dat is bedoeld voor categoriedetectie
categoryName De naam van de categorie waarvan de tekst moet worden gedetecteerd onder
version Versienummer van de categorie

API-reactie

Veld Beschrijving Voorbeeldwaarde
customCategoryAnalysis Object met het analyseresultaat voor de categorie.
detected Geeft aan of de opgegeven categorie is gedetecteerd. false

Andere bewerkingen voor aangepaste categorieën

Vergeet niet om de onderstaande tijdelijke aanduidingen te vervangen door uw werkelijke waarden voor de API-sleutel, het eindpunt en specifieke inhoud (categorienaam, definitie, enzovoort). Deze voorbeelden helpen u bij het beheren van de aangepaste categorieën in uw account.

Een aangepaste categorie of een specifieke versie ervan ophalen

Vervang de tijdelijke aanduidingen door uw eigen waarden en voer de volgende opdracht uit in een terminalvenster:

curl -X GET "<endpoint>/contentsafety/text/categories/<your_category_name>?api-version=2024-09-15-preview&version=1" \
     -H "Ocp-Apim-Subscription-Key: <your_api_key>" \
     -H "Content-Type: application/json"

Categorieën van hun nieuwste versies weergeven

Vervang de tijdelijke aanduidingen door uw eigen waarden en voer de volgende opdracht uit in een terminalvenster:

curl -X GET "<endpoint>/contentsafety/text/categories?api-version=2024-09-15-preview" \
     -H "Ocp-Apim-Subscription-Key: <your_api_key>" \
     -H "Content-Type: application/json"

Een aangepaste categorie of een specifieke versie ervan verwijderen

Vervang de tijdelijke aanduidingen door uw eigen waarden en voer de volgende opdracht uit in een terminalvenster:

curl -X DELETE "<endpoint>/contentsafety/text/categories/<your_category_name>?api-version=2024-09-15-preview&version=1" \
     -H "Ocp-Apim-Subscription-Key: <your_api_key>" \
     -H "Content-Type: application/json"