Omówienie niestandardowych typów modeli
Niestandardowe modele usługi Azure AI Vision mają różne funkcje na podstawie typu. Typy modeli niestandardowych obejmują klasyfikację obrazów, wykrywanie obiektów i rozpoznawanie produktów.
Klasyfikacja obrazów
Klasyfikacja obrazów to funkcja przetwarzania obrazów, w której model jest trenowany w celu przewidywania etykiety obrazu na podstawie zawartości całego obrazu. Zazwyczaj etykieta klasy odnosi się do głównego tematu obrazu, jednak poszczególne przypadki użycia mogą się różnić.
Na przykład następujące obrazy są klasyfikowane na podstawie typu owoców, które zawierają.
Modele można wytrenować pod kątem klasyfikacji wieloklasowej (w przypadku gdy istnieje wiele klas, ale każdy obraz może należeć tylko do jednej klasy) lub klasyfikacji wielu etykiet (gdzie obraz może być skojarzony z wieloma etykietami).
Wykrywanie obiektów
Wykrywanie obiektów to forma przetwarzania obrazów, w której model jest trenowany w celu wykrywania obecności i lokalizacji co najmniej jednej klasy obiektu na obrazie. Na przykład system wyewidencjonowania z włączoną sztuczną inteligencją w sklepie spożywczym może wymagać zidentyfikowania typu i lokalizacji zakupionych przedmiotów.
Istnieją dwa składniki wykrywania obiektów:
- Etykieta klasy każdego obiektu wykrytego na obrazie. Można na przykład przewidzieć, że obraz zawiera jedno jabłko i dwa pomarańcze.
- Lokalizacja każdego obiektu na obrazie wskazywana jako współrzędne pola ograniczenia otaczającego obiekt.
Rozpoznawanie produktów
Rozpoznawanie produktów działa tak samo, jak w przypadku wykrywania obiektów, ale z lepszą dokładnością etykiet produktów i nazw marek. Przewidywania dotyczące rozpoznawania produktów mają zarówno etykietę klasy, jak i lokalizację, co pozwala znać, gdzie na obrazie znajduje się produkt.