Bildbeskrivningar
Azure AI Vision kan analysera en bild och generera en mänsklig läsbar fras som beskriver dess innehåll. Tjänsten returnerar flera beskrivningar baserat på olika visuella funktioner och varje beskrivning får en konfidenspoäng. De slutliga utdata är en lista med beskrivningar ordnade från högsta till lägsta konfidens.
Engelska är det enda språk som stöds för bildbeskrivningar.
Prova funktionerna för bildtexter snabbt och enkelt i webbläsaren med hjälp av Vision Studio.
Exempel på bildbeskrivning
Följande JSON-svar illustrerar vad API:et Analysera bild returnerar när du beskriver exempelbilden baserat på dess visuella funktioner.
{
"description":{
"tags":[
"outdoor",
"city",
"white"
],
"captions":[
{
"text":"a city with tall buildings",
"confidence":0.48468858003616333
}
]
},
"requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
"metadata":{
"height":300,
"width":239,
"format":"Png"
},
"modelVersion":"2021-05-01"
}
Använda API:et
Bildbeskrivningsfunktionen är en del av API:et Analysera bild . Du kan anropa det här API:et via ett inbyggt SDK eller via REST-anrop. Inkludera Description
i frågeparametern visualFeatures . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "description"
avsnittet.
Nästa steg
Lär dig om relaterade begrepp för att tagga bilder och kategorisera bilder.