Bildkategorisierung
Zusätzlich zu Tags und einer Beschreibung gibt die Bildanalyse 3.2 die auf der Taxonomie basierenden Kategorien zurück, die in einem Bild erkannt wurden. Im Gegensatz zu Tags sind Kategorien in einer Über-/Unterordnungshierarchie organisiert. Außerdem gibt es weniger davon: 86 im Gegensatz zu Tausenden von Tags. Alle Kategorienamen sind in Englisch. Die Kategorisierung kann eigenständig oder parallel zum neueren Tagmodell erfolgen.
Die 86 Kategorien der Taxonomie
Azure KI Vision kann ein Bild mithilfe der in der folgenden Abbildung gezeigten Liste mit 86 Kategorien allgemein oder spezifisch kategorisieren. Die vollständige Taxonomie im Textformat finden Sie unter Kategorietaxonomie.
Beispiele für die Kategorisierung von Bildern
Die folgende JSON-Antwort veranschaulicht, was Azure KI Vision bei der Kategorisierung des Beispielbilds anhand seiner visuellen Merkmale zurückgibt.
{
"categories": [
{
"name": "people_",
"score": 0.81640625
}
],
"requestId": "bae7f76a-1cc7-4479-8d29-48a694974705",
"metadata": {
"height": 200,
"width": 300,
"format": "Jpeg"
}
}
Die folgende Tabelle zeigt einen typischen Satz von Bildern und die von Azure KI Vision zurückgegebene Kategorie für jedes Bild.
Abbildung | Category |
---|---|
people_group | |
animal_dog | |
outdoor_mountain | |
food_bread |
Verwenden der API
Das Kategorisierungsfeature ist Teil der Bildanalyse 3.2-API. Sie können diese API über ein natives SDK oder REST-Aufrufe aufrufen. Beziehen Sie Categories
in den Abfrageparameter visualFeatures ein. Nachdem Sie die vollständige JSON-Antwort erhalten haben, analysieren Sie einfach die Zeichenfolge auf den Inhalt im Abschnitt "categories"
.
Nächste Schritte
Machen Sie sich mit den verwandten Konzepten Taggen von Bildern und Beschreiben von Bildern vertraut.