Grundlegendes zu benutzerdefinierten Modelltypen

Abgeschlossen

Benutzerdefinierte Azure KI Vision-Modelle weisen je nach Typ unterschiedliche Funktionen auf. Zu den Typen von benutzerdefinierten Modellen gehören Bildklassifizierung, Objekterkennung und Produkterkennung.

Bildklassifizierung

Die Bildklassifizierung ist eine Funktion der Computervision, bei der ein Modell trainiert wird, um ein Etikett für ein Bild auf der Grundlage des Inhalts des gesamten Bilds vorherzusagen. In der Regel bezieht sich die Klassenbezeichnung auf das Hauptthema des Bilds, aber einzelne Anwendungsfälle können variieren.

Die folgenden Bilder sind zum Beispiel nach der Art der Früchte klassifiziert, die sie enthalten.

Diagram with three labeled photographs of fruit, classified as Apple, Banana, and Orange.

Modelle können für eine Mehrklassen-Klassifizierung (bei der es mehrere Klassen gibt, aber jedes Bild nur einer Klasse angehören kann) oder für eine Multi-Label-Klassifizierung (bei der ein Bild mit mehreren Etiketten verbunden sein kann) trainiert werden.

Objekterkennung

Die Objekterkennung ist eine Form des maschinellen Sehens, bei der ein Modell trainiert wird, um das Vorhandensein und die Position einer oder mehrere Objektklassen in einem Bild zu erkennen. Ein KI-gestütztes Kassensystem in einem Lebensmittelgeschäft könnte zum Beispiel die Art und den Ort der gekauften Artikel identifizieren müssen.

A photograph of fruit with the location and type of fruits detected.

Es gibt zwei Komponenten für die Objekterkennung:

  • Die Klassenbezeichnung jedes im Bild erkannten Objekts. Sie könnten zum Beispiel vorhersagen, dass ein Bild einen Apfel und zwei Orangen enthält.
  • Die Position jedes Objekts innerhalb des Bilds, die als Koordinaten eines Begrenzungsrahmens angegeben werden, der das Objekt umschließt.

Produkterkennung

Die Produkterkennung funktioniert auf die gleiche Weise wie die Objekterkennung, aber mit verbesserter Genauigkeit für Produktbezeichnungen und Markennamen. Die Vorhersagen für die Produkterkennung enthalten sowohl die Klassenbezeichnung als auch den Ort, so dass Sie wissen, wo im Bild sich das Produkt befindet.