Bildtexter (version 4.0)
Bildtexter i bildanalys 4.0 är tillgängliga via funktionerna Bildtext och Tät bildtext .
Funktionen Bildtext genererar en beskrivning med en mening av allt bildinnehåll. Kompakta bildtexter ger mer information genom att generera en meningsbeskrivningar av upp till 10 olika regioner i bilden förutom att beskriva hela bilden. Kompakta bildtexter returnerar också koordinater för avgränsningsrutor för de beskrivna bildregionerna. Båda dessa funktioner använder de senaste Florence-baserade AI-modellerna.
Bildtexter är endast tillgängliga på engelska.
Viktigt!
Bildtexter i Bildanalys 4.0 är endast tillgängliga i vissa Azure-datacenterregioner: se Regiontillgänglighet. Du måste använda en Azure AI Vision-resurs som finns i någon av dessa regioner för att få resultat från funktionerna Bildtext och Kompakta bildtexter.
Om du behöver använda en visionsresurs utanför dessa regioner för att generera bildtexter använder du Bildanalys 3.2 som är tillgänglig i alla Azure AI Vision-regioner.
Prova funktionerna för bildtexter snabbt och enkelt i webbläsaren med hjälp av Vision Studio.
Könsneutrala bildtexter
Som standard innehåller bildtexter könstermer ("man", "kvinna", "pojke" och "flicka"). Du har möjlighet att ersätta dessa termer med "person" i dina resultat och få könsneutrala bildtexter. Du kan göra det genom att ange den valfria API-begärandeparametern gender-neutral-caption
till true
i begärande-URL:en.
Exempel på bildtexter och kompakta bildtexter
Följande JSON-svar illustrerar vad API:et för bildanalys 4.0 returnerar när du beskriver exempelbilden baserat på dess visuella funktioner.
"captions": [
{
"text": "a man pointing at a screen",
"confidence": 0.4891590476036072
}
]
Använda API:et
Bildtextfunktionen är en del av API:et Analysera bild . Inkludera Caption
i frågeparametern funktioner . När du sedan får det fullständiga JSON-svaret parsar du strängen för innehållet i "captionResult"
avsnittet.
Nästa steg
- Lär dig det relaterade begreppet objektidentifiering.
- Snabbstart: REST API för bildanalys eller klientbibliotek
- Anropa API:et Analysera bild