Vysvětlení počítačového zpracování obrazu
Počítačové zpracování obrazu je oblast umělé inteligence, která se zabývá vizuálním zpracováním. Pojďme prozkoumat některé z možností, které počítačové zpracování obrazu přináší.
Skvělým příkladem výkonných možností počítačového zpracování obrazu je aplikace Seeing AI. Aplikace Seeing AI, navržená pro komunitu nevidomých a slabozrakých uživatelů, využívá sílu umělé inteligence k tomu, aby těmto uživatelům otevřela vizuální svět, a k popisu blízkých lidí, textu a objektů.
Další informace o aplikaci Seeing AI najdete v následujícím videu.
Další informace najdete na webové stránce Seeing AI.
Modely a možnosti počítačového zpracování obrazu
Většina řešení pro počítačové zpracování obrazu vychází z modelů strojového učení, které se dají aplikovat na vizuální vstup z fotoaparátů, videí nebo obrázků. Následující tabulka popisuje běžné úlohy počítačového zpracování obrazu.
Úkol | Popis |
---|---|
Klasifikace obrázku | V rámci klasifikace obrázků se trénuje model strojového učení tak, aby dokázal klasifikovat obrázky na základě jejich obsahu. Například v rámci řešení pro monitorování provozu můžete použít model klasifikace obrázků ke klasifikaci obrázků na základě typu vozidla, které tyto obrázky obsahují, jako jsou vozy taxislužby, autobusy, cyklisté atd. |
Detekce objektů | Modely strojového učení pro rozpoznávání objektů jsou trénovány pro klasifikaci jednotlivých objektů v rámci obrázku a určení jejich umístění pomocí ohraničujícího rámečku. V rámci řešení pro monitorování provozu se může například rozpoznávání objektů používat k identifikaci polohy různých tříd vozidel. |
Sémantická segmentace | Sémantická segmentace je pokročilá technika strojového učení, při které jsou jednotlivé pixely na obrázku klasifikovány podle objektu, ke kterému patří. Řešení pro monitorování provozu může například překrytím obrázků dopravního provozu vrstvami „masky“ zvýraznit různá vozidla konkrétními barvami. |
Analýza obrázků | Můžete vytvořit řešení, která kombinují modely strojového učení s pokročilými technikami analýzy obrázků za účelem získání informací z těchto obrázků, včetně „značek“, které by mohly pomoct katalogizovat obrázek, nebo dokonce popisných titulků shrnujících scénu vyobrazenou na obrázku. |
Detekce, analýza a rozpoznávání obličeje | Detekce obličeje je specializovaná forma rozpoznávání objektů, která na obrázku vyhledává lidské obličeje. To lze kombinovat s klasifikací a technikou analýzy geometrie obličeje, aby bylo možné rozpoznat jednotlivce na základě jejich obličejových rysů. |
Optické rozpoznávání znaků (OCR) | Optické rozpoznávání znaků je technika sloužící k rozpoznávání a čtení textu na obrázcích. Pomocí OCR můžete číst text na fotografiích (například dopravní značky nebo čela obchodů) nebo extrahovat informace ze skenovaných dokumentů, jako jsou dopisy, faktury nebo formuláře. |
Služby počítačového zpracování obrazu v Microsoft Azure
K vývoji řešení pro počítačové zpracování obrazu můžete použít Azure AI Vision od Microsoftu. Funkce služby jsou k dispozici pro použití a testování v nástroji Azure Vision Studio a dalších programovacích jazycích. Mezi funkce Azure AI Vision patří:
- Analýza obrázků: možnosti pro analýzu obrázků a videa a extrakci popisů, značek, objektů a textu.
- Rozpoznávání tváře: možnosti, které umožňují vytvářet řešení detekce tváří a rozpoznávání obličeje.
- Optické rozpoznávání znaků (OCR): funkce pro extrakci tištěného nebo rukou psaného textu z obrázků, které umožňují přístup k digitální verzi naskenovaného textu.