Så här skapar du ett anpassat textklassificeringsprojekt

Artikel
11/21/2024

Använd den här artikeln om du vill lära dig hur du konfigurerar kraven för att börja med anpassad textklassificering och skapa ett projekt.

Förutsättningar

Innan du börjar använda anpassad textklassificering behöver du:

En Azure-prenumeration – Skapa en kostnadsfritt.

Skapa en språkresurs

Innan du börjar använda anpassad textklassificering behöver du en Azure AI Language-resurs. Vi rekommenderar att du skapar språkresursen och ansluter ett lagringskonto till den i Azure Portal. När du skapar en resurs i Azure Portal kan du skapa ett Azure-lagringskonto samtidigt med alla nödvändiga behörigheter förkonfigurerade. Du kan också läsa mer i artikeln om du vill lära dig hur du använder en befintlig resurs och konfigurerar den så att den fungerar med anpassad textklassificering.

Du behöver också ett Azure Storage-konto där du laddar upp dina .txt dokument som ska användas för att träna en modell för att klassificera text.

Kommentar

Du måste ha en ägarroll tilldelad till resursgruppen för att skapa en språkresurs.
Om du ska ansluta ett befintligt lagringskonto bör du ha tilldelats en ägarroll .

Skapa språkresurs och ansluta lagringskonto

Kommentar

Du bör inte flytta lagringskontot till en annan resursgrupp eller prenumeration när det är länkat till språkresursen.

Skapa en ny resurs från Azure Portal

Gå till Azure Portal för att skapa en ny Azure AI Language-resurs.
I fönstret som visas väljer du Anpassad textklassificering och anpassad namngiven entitetsigenkänning från de anpassade funktionerna. Välj Fortsätt för att skapa resursen längst ned på skärmen.

Skapa en språkresurs med följande information.

Name	Obligatoriskt värde
Prenumeration	Din Azure-prenumeration.
Resursgrupp	En resursgrupp som ska innehålla din resurs. Du kan använda en befintlig eller skapa en ny.
Region	En av de regioner som stöds. Till exempel "USA, västra 2".
Name	Ett namn på resursen.
Prisnivå	En av de prisnivåer som stöds. Du kan använda nivån Kostnadsfri (F0) för att prova tjänsten.

Om du får ett meddelande om att ditt inloggningskonto inte är ägare till det valda lagringskontots resursgrupp måste ditt konto ha en ägarroll tilldelad till resursgruppen innan du kan skapa en Språkresurs. Kontakta din Azure-prenumerationsägare om du vill ha hjälp.

Du kan fastställa din Azure-prenumerationsägare genom att söka i resursgruppen och följa länken till den associerade prenumerationen. Sedan:

Välj fliken Åtkomstkontroll (IAM)
Välj Rolltilldelningar
Filtrera efter roll:Ägare.

I avsnittet Anpassad textklassificering och anpassad namngiven entitetsigenkänning väljer du ett befintligt lagringskonto eller väljer Nytt lagringskonto. Observera att dessa värden hjälper dig att komma igång och inte nödvändigtvis de lagringskontovärden som du vill använda i produktionsmiljöer. Undvik svarstider när du skapar projektet genom att ansluta till lagringskonton i samma region som språkresursen.

Lagringskontovärde Rekommenderat värde

Lagringskontonamn Valfritt namn

Storage account type Standard LRS
Kontrollera att meddelandet om ansvarsfull AI är markerat. Välj Granska + skapa längst ned på sidan.

Lagringskontovärde	Rekommenderat värde
Lagringskontonamn	Valfritt namn
Storage account type	Standard LRS

Skapa en ny språkresurs från Language Studio

Om det är första gången du loggar in visas ett fönster i Language Studio där du kan välja en befintlig språkresurs eller skapa en ny. Du kan också skapa en resurs genom att klicka på inställningsikonen i det övre högra hörnet, välja Resurser och sedan klicka på Skapa en ny resurs.

Skapa en språkresurs med följande information.

Instansinformation	Obligatoriskt värde
Azure-prenumeration	Din Azure-prenumeration
Azure-resursgrupp	Din Azure-resursgrupp
Azure-resursnamn	Ditt Azure-resursnamn
Plats	Den region där språkresursen finns.
Prisnivå	Prisnivån för din språkresurs.

Viktigt!

Se till att aktivera hanterad identitet när du skapar en språkresurs.
Läs och bekräfta meddelande om ansvarsfull AI

Om du vill använda anpassad textklassificering måste du ansluta resursen till ett lagringskonto. Om du inte har något kan du skapa ett Azure Storage-konto. Använd följande steg för att skapa ditt första projekt och ansluta ditt lagringskonto.

Logga in på Language Studio. Ett fönster visas där du kan välja din prenumeration och språkresurs. Välj språkresursen.
Under avsnittet Klassificera text i Language Studio väljer du Anpassad textklassificering.
Välj Skapa nytt projekt på den översta menyn på projektsidan. När du skapar ett projekt kan du märka data, träna, utvärdera, förbättra och distribuera dina modeller.
När du har klickat på Skapa nytt projekt visas ett fönster där du kan ansluta ditt lagringskonto. Om du redan har anslutit ett lagringskonto visas det anslutna lagringskontot. Om inte väljer du ditt lagringskonto i listrutan som visas och väljer Anslut lagringskonto. Detta anger de roller som krävs för ditt lagringskonto. Det här steget returnerar eventuellt ett fel om du inte har tilldelats som ägare på lagringskontot.
Kommentar
- Du behöver bara göra det här steget en gång för varje ny språkresurs som du använder.
- Den här processen kan inte ångras, om du ansluter ett lagringskonto till din Språkresurs kan du inte koppla från det senare.
- Du kan bara ansluta språkresursen till ett lagringskonto.
Välj projekttyp. Du kan antingen skapa ett klassificeringsprojekt för flera etiketter där varje dokument kan tillhöra en eller flera klasser eller ett klassificeringsprojekt med en etikett där varje dokument bara kan tillhöra en klass. Den valda typen kan inte ändras senare. Läs mer om projekttyper
Ange projektinformationen, inklusive ett namn, en beskrivning och språket för dokumenten i projektet. Om du använder exempeldatauppsättningen väljer du Engelska. Du kommer inte att kunna ändra namnet på projektet senare. Välj Nästa.

Dricks

Datamängden behöver inte vara helt på samma språk. Du kan ha flera dokument, var och en med olika språk som stöds. Om datamängden innehåller dokument med olika språk eller om du förväntar dig text från olika språk under körningen väljer du alternativet Aktivera flerspråkig datauppsättning när du anger grundläggande information för projektet. Det här alternativet kan aktiveras senare från sidan Projektinställningar .
Välj den container där du har laddat upp datamängden.

Kommentar

Om du redan har etiketterat dina data kontrollerar du att de följer formatet som stöds och väljer Ja, mina dokument är redan märkta och jag har formaterat JSON-etikettfilen och väljer etikettfilen i listrutan nedan.

Om du använder någon av exempeldatauppsättningarna använder du den inkluderade webOfScience_labelsFile filen eller movieLabels json-filen. Välj sedan Nästa.
Granska de data som du har angett och välj Skapa projekt.

Du kan skapa en ny resurs och ett lagringskonto med hjälp av följande CLI-mall- och parameterfiler som finns på GitHub.

Redigera följande värden i parameterfilen:

Parameternamn	Värdebeskrivning
`name`	Namnet på språkresursen
`location`	Den region där resursen finns. Mer information finns i regionstöd .
`sku`	Prisnivån för din resurs. Mer information finns i tjänstbegränsningar .
`storageResourceName`	Namnet på ditt lagringskonto
`storageLocation`	Region där ditt lagringskonto finns.
`storageSkuType`	SKU för ditt lagringskonto.
`storageResourceGroupName`	Resursgrupp för ditt lagringskonto

Använd följande PowerShell-kommando för att distribuera Azure Resource Manager-mallen (ARM) med de filer som du redigerade.

New-AzResourceGroupDeployment -Name ExampleDeployment -ResourceGroupName ExampleResourceGroup `
  -TemplateFile <path-to-arm-template> `
  -TemplateParameterFile <path-to-parameters-file>

Mer information om hur du distribuerar mallar och parameterfiler finns i dokumentationen för ARM-mallar.

Kommentar

Processen för att ansluta ett lagringskonto till språkresursen kan inte ångras. Den kan inte kopplas från senare.
Du kan bara ansluta språkresursen till ett lagringskonto.

Använda en befintlig språkresurs

Krav	Beskrivning
Regioner	Kontrollera att din befintliga resurs har etablerats i en av de regioner som stöds. Om du inte har en resurs måste du skapa en ny i en region som stöds.
Prisnivå	Prisnivån för din resurs.
Hanterad identitet	Kontrollera att resursens inställning för hanterad identitet är aktiverad. Annars läser du nästa avsnitt.

Om du vill använda anpassad textklassificering måste du skapa ett Azure Storage-konto om du inte redan har ett.

Aktivera identitetshantering för din resurs

Azure-portalen
Language Studio

Språkresursen måste ha identitetshantering för att aktivera den med hjälp av Azure Portal:

Gå till språkresursen
I den vänstra menyn går du till avsnittet Resurshantering och väljer Identitet
Från fliken Systemtilldelat ser du till att ange Status till På

Aktivera anpassad textklassificeringsfunktion

Se till att aktivera funktionen Anpassad textklassificering/anpassad namngiven entitetsigenkänning från Azure Portal.

Gå till språkresursen i Azure Portal
På menyn till vänster går du till avsnittet Resurshantering och väljer Funktioner
Aktivera anpassad textklassificering/funktion för anpassad namngiven entitetsigenkänning
Ansluta ditt lagringskonto
Välj Använd

Viktigt!

Kontrollera att språkresursen har tilldelats rollen storage blob data contributor på lagringskontot som du ansluter.

Ange roller för azure AI Language-resursen och lagringskontot

Använd följande steg för att ange de roller som krävs för språkresursen och lagringskontot.

Roller för din Azure AI Language-resurs

Gå till lagringskontot eller språkresursen i Azure Portal.
Välj Åtkomstkontroll (IAM) i den vänstra navigeringsmenyn.
Välj Lägg till för att lägga till rolltilldelningar och välj lämplig roll för ditt konto.

Du bör ha rollen ägare eller deltagare tilldelad till språkresursen.
I Tilldela åtkomst till väljer du Användare, grupp eller tjänstens huvudnamn
Välj Välj medlemmar
Välj ditt användarnamn. Du kan söka efter användarnamn i fältet Välj . Upprepa detta för alla roller.
Upprepa de här stegen för alla användarkonton som behöver åtkomst till den här resursen.

Roller för ditt lagringskonto

Gå till lagringskontosidan i Azure Portal.
Välj Åtkomstkontroll (IAM) i den vänstra navigeringsmenyn.
Välj Lägg till för att lägga till rolltilldelningar och välj rollen Lagringsblobdatadeltagare för lagringskontot.
I Tilldela åtkomst till väljer du Hanterad identitet.
Välj Välj medlemmar
Välj din prenumeration och Språk som hanterad identitet. Du kan söka efter användarnamn i fältet Välj .

Viktigt!

Om du har ett virtuellt nätverk eller en privat slutpunkt måste du välja Tillåt att Azure-tjänster i listan över betrodda tjänster får åtkomst till det här lagringskontot i Azure Portal.

Aktivera CORS för ditt lagringskonto

Se till att tillåta metoder (GET, PUT, DELETE) när du aktiverar CORS (Cross-Origin Resource Sharing). Ange fältet tillåtet ursprung till https://language.cognitive.azure.com. Tillåt alla sidhuvuden genom att lägga * till i de tillåtna rubrikvärdena och ange den maximala åldern till 500.

Skapa ett anpassat textklassificeringsprojekt

När resursen och lagringscontainern har konfigurerats skapar du ett nytt anpassat textklassificeringsprojekt. Ett projekt är ett arbetsområde för att skapa anpassade AI-modeller baserat på dina data. Ditt projekt kan bara nås av dig och andra som har åtkomst till den Azure-resurs som används. Om du har märkt data kan du importera dem för att komma igång.

Language Studio
REST API:er

Logga in på Language Studio. Ett fönster visas där du kan välja din prenumeration och språkresurs. Välj språkresursen.
Under avsnittet Klassificera text i Language Studio väljer du Anpassad textklassificering.
Välj Skapa nytt projekt på den översta menyn på projektsidan. När du skapar ett projekt kan du märka data, träna, utvärdera, förbättra och distribuera dina modeller.
När du har klickat på Skapa nytt projekt visas ett fönster där du kan ansluta ditt lagringskonto. Om du redan har anslutit ett lagringskonto visas det anslutna lagringskontot. Om inte väljer du ditt lagringskonto i listrutan som visas och väljer Anslut lagringskonto. Detta anger de roller som krävs för ditt lagringskonto. Det här steget returnerar eventuellt ett fel om du inte har tilldelats som ägare på lagringskontot.
Kommentar
- Du behöver bara göra det här steget en gång för varje ny språkresurs som du använder.
- Den här processen kan inte ångras, om du ansluter ett lagringskonto till din Språkresurs kan du inte koppla från det senare.
- Du kan bara ansluta språkresursen till ett lagringskonto.
Välj projekttyp. Du kan antingen skapa ett klassificeringsprojekt för flera etiketter där varje dokument kan tillhöra en eller flera klasser eller ett klassificeringsprojekt med en etikett där varje dokument bara kan tillhöra en klass. Den valda typen kan inte ändras senare. Läs mer om projekttyper
Ange projektinformationen, inklusive ett namn, en beskrivning och språket för dokumenten i projektet. Om du använder exempeldatauppsättningen väljer du Engelska. Du kommer inte att kunna ändra namnet på projektet senare. Välj Nästa.

Dricks

Datamängden behöver inte vara helt på samma språk. Du kan ha flera dokument, var och en med olika språk som stöds. Om datamängden innehåller dokument med olika språk eller om du förväntar dig text från olika språk under körningen väljer du alternativet Aktivera flerspråkig datauppsättning när du anger grundläggande information för projektet. Det här alternativet kan aktiveras senare från sidan Projektinställningar .
Välj den container där du har laddat upp datamängden.

Kommentar

Om du redan har etiketterat dina data kontrollerar du att de följer formatet som stöds och väljer Ja, mina dokument är redan märkta och jag har formaterat JSON-etikettfilen och väljer etikettfilen i listrutan nedan.

Om du använder någon av exempeldatauppsättningarna använder du den inkluderade webOfScience_labelsFile filen eller movieLabels json-filen. Välj sedan Nästa.
Granska de data som du har angett och välj Skapa projekt.

Om du vill börja skapa en anpassad textklassificeringsmodell måste du skapa ett projekt. När du skapar ett projekt kan du märka data, träna, utvärdera, förbättra och distribuera dina modeller.

Kommentar

Projektnamnet är skiftlägeskänsligt för alla åtgärder.

Skapa en PATCH-begäran med hjälp av följande URL, rubriker och JSON-brödtext för att skapa projektet.

Begärans-URL

Använd följande URL för att skapa ett projekt. Ersätt platshållarvärdena nedan med dina egna värden.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}?api-version={API-VERSION}

Platshållare	Värde	Exempel
`{ENDPOINT}`	Slutpunkten för att autentisera din API-begäran.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
`{API-VERSION}`	Den version av API:et som du anropar. Värdet som refereras här är för den senaste versionen som släppts. Mer information om andra tillgängliga API-versioner finns i Modelllivscykel .	`2022-05-01`

Sidhuvuden

Använd följande rubrik för att autentisera din begäran.

Tangent	Värde
`Ocp-Apim-Subscription-Key`	Nyckeln till resursen. Används för att autentisera dina API-begäranden.

Brödtext

Använd följande JSON i din begäran. Ersätt platshållarvärdena nedan med dina egna värden.

Klassificering av flera etiketter
Klassificering med en etikett

{
  "projectName": "{PROJECT-NAME}",
  "language": "{LANGUAGE-CODE}",
  "projectKind": "customMultiLabelClassification",
  "description": "Project description",
  "multilingual": "True",
  "storageInputContainerName": "{CONTAINER-NAME}"
}

Nyckel	Platshållare	Värde	Exempel
projektnamn	`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
språk	`{LANGUAGE-CODE}`	En sträng som anger språkkoden för de dokument som används i projektet. Om projektet är ett flerspråkigt projekt väljer du språkkoden för de flesta dokumenten. Mer information om språkkoder som stöds finns i språkstöd .	`en-us`
projectKind	`customMultiLabelClassification`	Din projekttyp.	`customMultiLabelClassification`
flerspråkig	`true`	Ett booleskt värde som gör att du kan ha dokument på flera språk i datauppsättningen och när din modell distribueras kan du fråga modellen på alla språk som stöds (inte nödvändigtvis i dina träningsdokument. Mer information om flerspråkig support finns i språkstöd .	`true`
storageInputContainerName	`{CONTAINER-NAME}`	Namnet på din Azure Storage-container där du har laddat upp dina dokument.	`myContainer`

{
  "projectName": "{PROJECT-NAME}",
  "language": "{LANGUAGE-CODE}",
  "projectKind": "customSingleLabelClassification",
  "description": "Project description",
  "multilingual": "True",
  "storageInputContainerName": "{CONTAINER-NAME}"
}

Nyckel	Platshållare	Värde	Exempel
projektnamn	`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
språk	`{LANGUAGE-CODE}`	En sträng som anger språkkoden för de dokument som används i projektet. Om projektet är ett flerspråkigt projekt väljer du språkkoden för de flesta dokumenten. Mer information om språkkoder som stöds finns i språkstöd .	`en-us`
projectKind	`customSingleLabelClassification`	Din projekttyp.	`customSingleLabelClassification`
flerspråkig	`true`	Ett booleskt värde som gör att du kan ha dokument på flera språk i datauppsättningen och när din modell distribueras kan du fråga modellen på alla språk som stöds (inte nödvändigtvis i dina träningsdokument. Mer information om flerspråkig support finns i språkstöd .	`true`
storageInputContainerName	`{CONTAINER-NAME}`	Namnet på din Azure Storage-container där du har laddat upp dina dokument.	`myContainer`

Den här begäran returnerar ett 201-svar, vilket innebär att projektet skapas.

Den här begäran returnerar ett fel om:

Den valda resursen har inte rätt behörighet för lagringskontot.

Importera ett anpassat textklassificeringsprojekt

Om du redan har etiketterat data kan du använda dem för att komma igång med tjänsten. Kontrollera att dina etiketterade data följer de godkända dataformaten.

Language Studio
REST API:er

Logga in på Language Studio. Ett fönster visas där du kan välja din prenumeration och språkresurs. Välj språkresursen.
Under avsnittet Klassificera text i Language Studio väljer du Anpassad textklassificering.
Välj Skapa nytt projekt på den översta menyn på projektsidan. När du skapar ett projekt kan du märka data, träna, utvärdera, förbättra och distribuera dina modeller.
När du har valt Skapa nytt projekt visas en skärm där du kan ansluta ditt lagringskonto. Om du inte hittar ditt lagringskonto kontrollerar du att du har skapat en resurs med hjälp av de rekommenderade stegen. Om du redan har anslutit ett lagringskonto till språkresursen ser du att ditt lagringskonto är anslutet.
Kommentar
- Du behöver bara göra det här steget en gång för varje ny språkresurs som du använder.
- Den här processen kan inte ångras, om du ansluter ett lagringskonto till din Språkresurs kan du inte koppla från det senare.
- Du kan bara ansluta språkresursen till ett lagringskonto.
Välj projekttyp. Du kan antingen skapa ett klassificeringsprojekt för flera etiketter där varje dokument kan tillhöra en eller flera klasser eller ett klassificeringsprojekt med en etikett där varje dokument bara kan tillhöra en klass. Den valda typen kan inte ändras senare.
Ange projektinformationen, inklusive ett namn, en beskrivning och språket för dokumenten i projektet. Du kommer inte att kunna ändra namnet på projektet senare. Välj Nästa.

Dricks

Datamängden behöver inte vara helt på samma språk. Du kan ha flera dokument, var och en med olika språk som stöds. Om datamängden innehåller dokument med olika språk eller om du förväntar dig text från olika språk under körningen väljer du alternativet Aktivera flerspråkig datauppsättning när du anger grundläggande information för projektet. Det här alternativet kan aktiveras senare från sidan Projektinställningar .
Välj den container där du har laddat upp datamängden.
Välj Ja, mina dokument är redan märkta och jag har formaterat JSON-etikettfilen och väljer etikettfilen i den nedrullningsbara menyn nedan för att importera JSON-etikettfilen. Kontrollera att det följer formatet som stöds.
Välj Nästa.
Granska de data som du har angett och välj Skapa projekt.

Skicka en POST-begäran med hjälp av följande URL, rubriker och JSON-brödtext för att importera din etikettfil. Kontrollera att din etikettfil följer det godkända formatet.

Om det redan finns ett projekt med samma namn ersätts data för projektet.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}/:import?api-version={API-VERSION}

Platshållare	Värde	Exempel
`{ENDPOINT}`	Slutpunkten för att autentisera din API-begäran.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
`{API-VERSION}`	Den version av API:et som du anropar. Värdet som refereras här är för den senaste versionen som släppts. Läs mer om andra tillgängliga API-versioner	`2022-05-01`

Sidhuvuden

Använd följande rubrik för att autentisera din begäran.

Tangent	Värde
`Ocp-Apim-Subscription-Key`	Nyckeln till resursen. Används för att autentisera dina API-begäranden.

Brödtext

Använd följande JSON i din begäran. Ersätt platshållarvärdena nedan med dina egna värden.

Klassificering av flera etiketter
Klassificering med en etikett

{
  "projectFileVersion": "{API-VERSION}",
  "stringIndexType": "Utf16CodeUnit",
  "metadata": {
    "projectName": "{PROJECT-NAME}",
    "storageInputContainerName": "{CONTAINER-NAME}",
    "projectKind": "customMultiLabelClassification",
    "description": "Trying out custom multi label text classification",
    "language": "{LANGUAGE-CODE}",
    "multilingual": true,
    "settings": {}
  },
  "assets": {
    "projectKind": "customMultiLabelClassification",
    "classes": [
      {
        "category": "Class1"
      },
      {
        "category": "Class2"
      }
    ],
    "documents": [
      {
        "location": "{DOCUMENT-NAME}",
        "language": "{LANGUAGE-CODE}",
        "dataset": "{DATASET}",
        "classes": [
          {
            "category": "Class1"
          },
          {
            "category": "Class2"
          }
        ]
      },
      {
        "location": "{DOCUMENT-NAME}",
        "language": "{LANGUAGE-CODE}",
        "dataset": "{DATASET}",
        "classes": [
          {
            "category": "Class2"
          }
        ]
      }
    ]
  }
}

Nyckel	Platshållare	Värde	Exempel
api-version	`{API-VERSION}`	Den version av API:et som du anropar. Den version som används här måste vara samma API-version i URL:en. Läs mer om andra tillgängliga API-versioner	`2022-05-01`
projektnamn	`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
projectKind	`customMultiLabelClassification`	Din projekttyp.	`customMultiLabelClassification`
språk	`{LANGUAGE-CODE}`	En sträng som anger språkkoden för de dokument som används i projektet. Om projektet är ett flerspråkigt projekt väljer du språkkoden för de flesta dokumenten. Mer information om flerspråkig support finns i språkstöd .	`en-us`
flerspråkig	`true`	Ett booleskt värde som gör att du kan ha dokument på flera språk i datauppsättningen och när din modell distribueras kan du fråga modellen på alla språk som stöds (inte nödvändigtvis i dina träningsdokument. Mer information om flerspråkig support finns i språkstöd .	`true`
storageInputContainerName	`{CONTAINER-NAME}`	Namnet på din Azure Storage-container där du har laddat upp dina dokument.	`myContainer`
klasser	[]	Matris som innehåller alla klasser som du har i projektet. Det här är de klasser som du vill klassificera dina dokument i.	[]
documents	[]	Matris som innehåller alla dokument i projektet och vilka klasser som är märkta för det här dokumentet.	[]
plats	`{DOCUMENT-NAME}`	Platsen för dokumenten i lagringscontainern. Eftersom alla dokument finns i roten i containern bör detta vara dokumentnamnet.	`doc1.txt`
datauppsättning	`{DATASET}`	Testuppsättningen som det här dokumentet ska gå till när det delas upp före träningen. Mer information om datadelning finns i Träna en modell . Möjliga värden för det här fältet är `Train` och `Test`.	`Train`

{
  "projectFileVersion": "{API-VERSION}",
  "stringIndexType": "Utf16CodeUnit",
  "metadata": {
    "projectName": "{PROJECT-NAME}",
    "storageInputContainerName": "{CONTAINER-NAME}",
    "projectKind": "customSingleLabelClassification",
    "description": "Trying out custom multi label text classification",
    "language": "{LANGUAGE-CODE}",
    "multilingual": true,
    "settings": {}
  },
  "assets": {
    "projectKind": "customSingleLabelClassification",
        "classes": [
            {
                "category": "Class1"
            },
            {
                "category": "Class2"
            }
        ],
        "documents": [
            {
                "location": "{DOCUMENT-NAME}",
                "language": "{LANGUAGE-CODE}",
                "dataset": "{DATASET}",
                "class": {
                    "category": "Class2"
                }
            },
            {
                "location": "{DOCUMENT-NAME}",
                "language": "{LANGUAGE-CODE}",
                "dataset": "{DATASET}",
                "class": {
                    "category": "Class1"
                }
            }
        ]
    }
}

Nyckel	Platshållare	Värde	Exempel
api-version	`{API-VERSION}`	Den version av API:et som du anropar. Den version som används här måste vara samma API-version i URL:en.	`2022-05-01`
projektnamn	`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
projectKind	`customSingleLabelClassification`	Din projekttyp.	`customSingleLabelClassification`
språk	`{LANGUAGE-CODE}`	En sträng som anger språkkoden för de dokument som används i projektet. Om projektet är ett flerspråkigt projekt väljer du språkkoden för de flesta dokumenten. Mer information om språkkoder som stöds finns i språkstöd .	`en-us`
flerspråkig	`true`	Ett booleskt värde som gör att du kan ha dokument på flera språk i datauppsättningen och när din modell distribueras kan du fråga modellen på alla språk som stöds (inte nödvändigtvis i dina träningsdokument. Mer information om flerspråkig support finns i språkstöd .	`true`
storageInputContainerName	`{CONTAINER-NAME}`	Namnet på din Azure Storage-container där du har laddat upp dina dokument.	`myContainer`
klasser	[]	Matris som innehåller alla klasser som du har i projektet. Det här är de klasser som du vill klassificera dina dokument i.	[]
documents	[]	Matris som innehåller alla dokument i projektet och vilken klass det här dokumentet tillhör.	[]
plats	`{DOCUMENT-NAME}`	Platsen för dokumenten i lagringscontainern. Eftersom alla dokument finns i roten i containern bör detta vara dokumentnamnet.	`doc1.txt`
datauppsättning	`{DATASET}`	Testuppsättningen som det här dokumentet ska gå till när det delas upp före träningen. Mer information om datadelning finns i Träna en modell . Möjliga värden för det här fältet är `Train` och `Test`.	`Train`

När du har skickat din API-begäran får du ett 202 svar som anger att jobbet har skickats korrekt. Extrahera värdet i svarshuvudena operation-location . Den formateras så här:

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}/import/jobs/{JOB-ID}?api-version={API-VERSION}

{JOB-ID} används för att identifiera din begäran, eftersom den här åtgärden är asynkron. Du använder den här URL:en för att hämta status för importjobbet.

Möjliga felscenarier för den här begäran:

Den valda resursen har inte rätt behörigheter för lagringskontot.
Den storageInputContainerName angivna finns inte.
Ogiltig språkkod används, eller om språkkodtypen inte är sträng.
multilingual värdet är en sträng och inte ett booleskt värde.

Gå till sidan projektinställningar i Language Studio.
Du kan se projektinformation.
På den här sidan kan du uppdatera projektbeskrivningen och aktivera/inaktivera flerspråkig datauppsättning i projektinställningar.
Du kan också visa det anslutna lagringskontot och containern till språkresursen.
Du kan också hämta resursens primärnyckel från den här sidan.

Om du vill få information om projektinformation för anpassad textklassificering skickar du en GET-begäran med hjälp av följande URL och rubriker. Ersätt platshållarvärdena med dina egna värden.

{ENDPOINT}/language/authoring/analyze-text/projects/{PROJECT-NAME}?api-version={API-VERSION}

Platshållare	Värde	Exempel
`{ENDPOINT}`	Slutpunkten för att autentisera din API-begäran.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
`{API-VERSION}`	Den version av API:et som du anropar. Värdet som refereras här är för den senaste versionen av modellen.	`2022-05-01`

Sidhuvuden

Använd följande rubrik för att autentisera din begäran.

Tangent	Värde
`Ocp-Apim-Subscription-Key`	Nyckeln till resursen. Används för att autentisera dina API-begäranden.

Svarstext

När du har skickat begäran får du följande svar.

{
  "createdDateTime": "2022-04-23T13:39:09.384Z",
  "lastModifiedDateTime": "2022-04-23T13:39:09.384Z",
  "lastTrainedDateTime": "2022-04-23T13:39:09.384Z",
  "lastDeployedDateTime": "2022-04-23T13:39:09.384Z",
  "projectKind": "customSingleLabelClassification",
  "storageInputContainerName": "{CONTAINER-NAME}",
  "projectName": "{PROJECT-NAME}",
  "multilingual": true,
  "description": "Project description",
  "language": "{LANGUAGE-CODE}"
}

Värde	platshållare	Beskrivning	Exempel
`projectKind`	`customSingleLabelClassification`	Din projekttyp.	Det här värdet kan vara `customSingleLabelClassification` eller `customMultiLabelClassification`.
`storageInputContainerName`	`{CONTAINER-NAME}`	Namnet på din Azure Storage-container där du har laddat upp dina dokument.	`myContainer`
`projectName`	`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
`multilingual`		Ett booleskt värde som gör att du kan ha dokument på flera språk i datauppsättningen. När din modell har distribuerats kan du fråga modellen på valfritt språk som stöds (inte nödvändigtvis i dina träningsdokument. Mer information om flerspråkigt stöd finns i språkstöd.	`true`
`language`	`{LANGUAGE-CODE}`	En sträng som anger språkkoden för de dokument som används i projektet. Om projektet är ett flerspråkigt projekt väljer du språkkoden för de flesta dokumenten. Mer information om språkkoder som stöds finns i språkstöd .	`en-us`

När du har skickat din API-begäran får du ett 200 svar som anger lyckad och JSON-svarstext med projektinformationen.

Ta bort projekt

Language Studio
REST API:er

När du inte längre behöver projektet kan du ta bort projektet med Hjälp av Language Studio. Välj Anpassad textklassificering överst och välj sedan det projekt som du vill ta bort. Välj Ta bort på den översta menyn för att ta bort projektet.

När du inte längre behöver projektet kan du ta bort det med följande DELETE-begäran . Ersätt platshållarvärdena med dina egna värden.

{Endpoint}/language/authoring/analyze-text/projects/{projectName}?api-version={API-VERSION}

Platshållare	Värde	Exempel
`{ENDPOINT}`	Slutpunkten för att autentisera din API-begäran.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Namnet på projektet. Det här värdet är skiftlägeskänsligt.	`myProject`
`{API-VERSION}`	Den version av API:et som du anropar. Värdet som refereras här är för den senaste versionen som släppts. Läs mer om andra tillgängliga API-versioner	`2022-05-01`

Sidhuvuden

Använd följande rubrik för att autentisera din begäran.

Tangent	Värde
Ocp-Apim-Subscription-Key	Nyckeln till resursen. Används för att autentisera dina API-begäranden.

När du har skickat din API-begäran får du ett 202 svar som anger att projektet har slutförts, vilket innebär att projektet har tagits bort. Ett lyckat anrop resulterar i ett Operation-Location huvud som används för att kontrollera jobbets status.

Nästa steg

Du bör ha en uppfattning om det projektschema som du ska använda för att märka dina data.
När projektet har skapats kan du börja märka dina data, vilket informerar din textklassificeringsmodell om hur text tolkas och används för träning och utvärdering.

Dela via

Så här skapar du ett anpassat textklassificeringsprojekt

Förutsättningar

Skapa en språkresurs

Skapa språkresurs och ansluta lagringskonto

Skapa en ny resurs från Azure Portal

Skapa en ny språkresurs från Language Studio

Använda en befintlig språkresurs

Aktivera identitetshantering för din resurs

Aktivera anpassad textklassificeringsfunktion

Ange roller för azure AI Language-resursen och lagringskontot

Roller för din Azure AI Language-resurs

Roller för ditt lagringskonto

Aktivera CORS för ditt lagringskonto

Skapa ett anpassat textklassificeringsprojekt

Begärans-URL

Sidhuvuden

Brödtext

Importera ett anpassat textklassificeringsprojekt

Sidhuvuden

Brödtext

Hämta projektinformation

Sidhuvuden

Svarstext

Ta bort projekt

Sidhuvuden

Nästa steg

Feedback

Ytterligare resurser