Omówienie niestandardowych typów modeli

Ukończone

Niestandardowe modele usługi Azure AI Vision mają różne funkcje na podstawie typu. Typy modeli niestandardowych obejmują klasyfikację obrazów, wykrywanie obiektów i rozpoznawanie produktów.

Klasyfikacja obrazów

Klasyfikacja obrazów to funkcja przetwarzania obrazów, w której model jest trenowany w celu przewidywania etykiety obrazu na podstawie zawartości całego obrazu. Zazwyczaj etykieta klasy odnosi się do głównego tematu obrazu, jednak poszczególne przypadki użycia mogą się różnić.

Na przykład następujące obrazy są klasyfikowane na podstawie typu owoców, które zawierają.

Diagram with three labeled photographs of fruit, classified as Apple, Banana, and Orange.

Modele można wytrenować pod kątem klasyfikacji wieloklasowej (w przypadku gdy istnieje wiele klas, ale każdy obraz może należeć tylko do jednej klasy) lub klasyfikacji wielu etykiet (gdzie obraz może być skojarzony z wieloma etykietami).

Wykrywanie obiektów

Wykrywanie obiektów to forma przetwarzania obrazów, w której model jest trenowany w celu wykrywania obecności i lokalizacji co najmniej jednej klasy obiektu na obrazie. Na przykład system wyewidencjonowania z włączoną sztuczną inteligencją w sklepie spożywczym może wymagać zidentyfikowania typu i lokalizacji zakupionych przedmiotów.

A photograph of fruit with the location and type of fruits detected.

Istnieją dwa składniki wykrywania obiektów:

  • Etykieta klasy każdego obiektu wykrytego na obrazie. Można na przykład przewidzieć, że obraz zawiera jedno jabłko i dwa pomarańcze.
  • Lokalizacja każdego obiektu na obrazie wskazywana jako współrzędne pola ograniczenia otaczającego obiekt.

Rozpoznawanie produktów

Rozpoznawanie produktów działa tak samo, jak w przypadku wykrywania obiektów, ale z lepszą dokładnością etykiet produktów i nazw marek. Przewidywania dotyczące rozpoznawania produktów mają zarówno etykietę klasy, jak i lokalizację, co pozwala znać, gdzie na obrazie znajduje się produkt.