Dela via


Bildbeskrivningar

Azure AI Vision kan analysera en bild och generera en mänsklig läsbar fras som beskriver dess innehåll. Tjänsten returnerar flera beskrivningar baserat på olika visuella funktioner och varje beskrivning får en konfidenspoäng. De slutliga utdata är en lista med beskrivningar ordnade från högsta till lägsta konfidens.

Engelska är det enda språk som stöds för bildbeskrivningar.

Prova funktionerna för bildtexter snabbt och enkelt i webbläsaren med hjälp av Vision Studio.

Exempel på bildbeskrivning

Följande JSON-svar illustrerar vad API:et Analysera bild returnerar när du beskriver exempelbilden baserat på dess visuella funktioner.

En svartvit bild av byggnader på Manhattan

{
   "description":{
      "tags":[
         "outdoor",
         "city",
         "white"
      ],
      "captions":[
         {
            "text":"a city with tall buildings",
            "confidence":0.48468858003616333
         }
      ]
   },
   "requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
   "metadata":{
      "height":300,
      "width":239,
      "format":"Png"
   },
   "modelVersion":"2021-05-01"
}

Använda API:et

Bildbeskrivningsfunktionen är en del av API:et Analysera bild . Du kan anropa det här API:et via ett inbyggt SDK eller via REST-anrop. Inkludera Description i frågeparametern visualFeatures . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "description" avsnittet.

Nästa steg

Lär dig om relaterade begrepp för att tagga bilder och kategorisera bilder.