Bildbeschriftungen (Version 4.0)
Bildbeschriftungen in Bildanalyse 4.0 sind über die Features Beschriftung und Dichte Beschriftungen verfügbar.
Das Feature „Beschriftung“ generiert eine Beschreibung in einem Satz für alle Bildinhalte. „Dichte Beschriftungen“ bietet mehr Details, indem zusätzlich zur Beschreibung des gesamten Bilds Beschreibungen von bis zu 10 verschiedenen Bereichen des Bilds in einem Satz generiert werden. Dense Captions gibt auch Begrenzungsrahmenkoordinaten der beschriebenen Bildbereiche zurück. Beide Features verwenden die neuesten auf Florence basierenden KI-Modelle.
Die Bildbeschriftung ist nur in englischer Sprache verfügbar.
Wichtig
Bildbeschriftungen in Image Analysis 4.0 sind nur in bestimmten Azure-Rechenzentrumsregionen verfügbar. Informationen dazu finden Sie unter Regionale Verfügbarkeit. Sie müssen eine Azure KI Vision-Ressource in einer dieser Regionen verwenden, um Ergebnisse aus den Funktionen „Beschriftung“ und „Dichte Beschriftungen“ zu erhalten.
Wenn Sie eine Vision-Ressource außerhalb dieser Regionen verwenden müssen, um Bildbeschriftungen zu generieren, verwenden Sie Bildanalyse 3.2, die in allen Azure KI Vision-Regionen verfügbar ist.
Testen Sie mithilfe von Vision Studio die Features zur Bilduntertitelung ganz schnell und einfach in Ihrem Browser.
Geschlechtsneutrale Beschriftungen
Beschriftungen enthalten standardmäßig Geschlechtsbegriffe: „Mann“, „Frau“, „Junge“ und „Mädchen“. Sie haben die Möglichkeit, diese Begriffe in Ihren Ergebnissen durch „Person“ zu ersetzen und geschlechtsneutrale Bestimmungen zu erhalten. Hierzu können Sie den optionalen API-Anforderungsparameter gender-neutral-caption
in der Anforderungs-URL auf true
festlegen.
Beispiele für „Beschriftung“ und „Dichte Beschriftung“
Die folgende JSON-Antwort veranschaulicht, was die Bildanalyse 4.0-API bei der Beschreibung des Beispielbilds anhand seiner visuellen Merkmale zurückgibt.
"captions": [
{
"text": "a man pointing at a screen",
"confidence": 0.4891590476036072
}
]
Verwenden der API
Die Bildbeschriftungsfunktion ist Teil der Bildanalyse-API. Beziehen Sie Caption
in den Abfrageparameter features ein. Nachdem Sie die vollständige JSON-Antwort erhalten haben, analysieren Sie die Zeichenfolge auf die Inhalte im Abschnitt "captionResult"
.
Nächste Schritte
- Lernen Sie das damit verbundene Konzept der Objekterkennung kennen.
- Schnellstart: REST-API oder Clientbibliotheken für die Bildanalyse
- Aufrufen der Bildanalyse-API