Rozpoznávání tváře, atributy a vstupní data
Upozornění
Přístup ke službě Rozpoznávání tváře je omezený na základě kritérií způsobilosti a použití, aby bylo možné podporovat naše zásady zodpovědné umělé inteligence. Služba Rozpoznávání tváře je dostupná jenom pro zákazníky a partnery spravované Microsoftem. Pro přístup použijte formulář pro příjem rozpoznávání tváře. Další informace najdete na stránce s omezeným přístupem k tváři.
Důležité
Atributy tváře se predikují pomocí statistických algoritmů. Nemusí být vždy přesné. Při rozhodování na základě dat atributů buďte opatrní. Vyhýbejte se používání těchto atributů pro falšování identity. Místo toho doporučujeme používat detekci rozpoznávání tváře. Další informace najdete v kurzu: Detekce živých tváří.
Tento článek vysvětluje koncepty rozpoznávání tváře a dat atributů tváře. Rozpoznávání tváře je proces vyhledání lidských tváří na obrázku a volitelně vrácení různých druhů dat souvisejících s tvářemi.
K detekci tváří na obrázku použijete rozhraní API Pro rozpoznávání. Pokud chcete začít používat rozhraní REST API nebo klientskou sadu SDK, postupujte podle rychlého startu služby Rozpoznávání tváře. Nebo podrobnějšího průvodce najdete v tématu Volání rozhraní API pro detekci.
Obdélník tváře
Každá zjištěná tvář odpovídá poli faceRectangle v odpovědi. Toto je sada souřadnic pixelů pro levou, horní, šířku a výšku rozpoznané tváře. Pomocí těchto souřadnic můžete získat umístění a velikost tváře. V odpovědi rozhraní API jsou tváře uvedené v pořadí od největších po nejmenší.
Vyzkoušejte možnosti detekce tváří rychle a snadno pomocí nástroje Azure AI Vision Studio.
ID tváře
ID tváře je jedinečný řetězec identifikátoru pro každou rozpoznanou tvář na obrázku. Face ID vyžaduje schválení omezeného přístupu, na které můžete požádat vyplněním formuláře pro příjem. Další informace najdete na stránce omezeného přístupu k rozhraní API pro rozpoznávání tváře. Ve volání rozhraní API Detect si můžete vyžádat ID tváře.
Orientační body tváře
Orientační body tváře jsou sadou snadno najítelné body na obličeji, jako jsou žáky nebo špička nosu. Standardně existuje 27 předdefinovaných orientačních bodů. Následující obrázek znázorňuje všech 27 bodů:
Souřadnice bodů se vrátí v jednotkách pixelů.
Model Detection_03 má aktuálně nejpřesnější detekci orientačních bodů. Orientační body oka a žáka, které vrací, jsou dostatečně přesné, aby bylo možné sledovat pohled na tvář.
Atributy
Upozornění
Společnost Microsoft vyřadila nebo omezila možnosti rozpoznávání obličeje, které se dají použít k odvozování emocionálních stavů a atributů identity, které mohou v případě zneužití podléhat stereotypům, diskriminaci nebo nespravedlivému odepření služeb. Vyřazené funkce jsou emoce a pohlaví. Omezené schopnosti jsou věk, úsměv, obličejové vlasy, vlasy a make-up. Pokud máte zodpovědný případ použití, který by pro vás mohl využívat některou z omezených funkcí, pošlete e-mailem rozhraní API pro rozpoznávání tváře Azure. Další informace o tomto rozhodnutí najdete tady.
Atributy jsou sada funkcí, které lze volitelně zjistit rozhraním API pro detekci. Lze zjistit následující atributy:
Příslušenství: Určuje, zda má daná tvář příslušenství. Tento atribut vrátí možné příslušenství, včetně oblečení, brýle a masky, s skóre spolehlivosti mezi nulou a jednou pro každý příslušenství.
Rozostření: Označuje rozmazanost tváře na obrázku. Tento atribut vrátí hodnotu mezi nulou a jednou a neformálním hodnocením nízké, střední nebo vysoké.
Expozice: Označuje expozici tváře na obrázku. Tento atribut vrátí hodnotu mezi nulou a jednou a neformálním hodnocením underExposure, goodExposure nebo overExposure.
Brýle: Označuje, jestli má daná tvář brýle. Možné hodnoty jsou NoGlasses, ReadingGlasses, Sunglasses a Swimming Goggles.
Pozice hlavy: Označuje orientaci tváře ve 3D prostoru. Tento atribut popisuje roll, yaw a rozteč úhlů ve stupních, které jsou definovány podle pravého pravidla. Pořadí tří úhlů je roll-yaw-pitch a rozsah hodnot každého úhlu je od -180 stupňů do +180 stupňů. 3D orientace tváře se odhaduje podle úhlů hodů, pil a rozteč. Mapování úhlů najdete v následujícím diagramu:
Další informace o použití těchto hodnot naleznete v tématu Použití atributu HeadPose.
Maska: Označuje, jestli má obličej masku. Tento atribut vrátí možný typ masky a logickou hodnotu označující, zda jsou nos a ústa pokryty.
Šum: Označuje vizuální šum zjištěný na obrázku tváře. Tento atribut vrátí hodnotu mezi nulou a jednou a neformální hodnocení nízké, střední nebo vysoké.
Okluze: Označuje, zda jsou objekty blokující části tváře. Tento atribut vrátí logickou hodnotu pro eyeOccluded, foreheadOccluded a mouthOccluded.
QualityForRecognition: Označuje celkovou kvalitu obrázku, která určuje, jestli je obrázek použitý v detekci dostatečné kvality pro pokus o rozpoznávání tváře. Hodnota je neformální hodnocení nízké, střední nebo vysoké. Pro registraci osob se doporučuje jenom obrázky s vysokou kvalitou a pro scénáře identifikace se doporučuje kvalita v nebo lepším než médium .
Poznámka:
Dostupnost jednotlivých atributů závisí na zadaném modelu detekce. Atribut QualityForRecognition také závisí na modelu rozpoznávání, protože je aktuálně k dispozici pouze při použití kombinace modelu detekce detection_01 nebo detection_03 a modelu rozpoznávání recognition_03 nebo recognition_04.
Požadavky na vstup
Pomocí následujících tipů se ujistěte, že vstupní obrázky poskytují nejpřesnější výsledky detekce:
- Podporované vstupní formáty obrázků jsou JPEG, PNG, GIF (první snímek), BMP.
- Velikost souboru obrázku by neměla být větší než 6 MB.
- Minimální zjistitelná velikost tváře je 36 × 36 pixelů na obrázku, který není větší než 1920 × 1080 pixelů. Obrázky s většími než 1920 x 1080 pixely mají proporcionálně větší minimální velikost obličeje. Zmenšení velikosti tváře může způsobit, že se některé tváře nezjistí, i když jsou větší než minimální zjistitelná velikost tváře.
- Maximální zjistitelná velikost obličeje je 4096 × 4096 pixelů.
- Tváře mimo rozsah velikosti 36 x 36 až 4096 x 4096 pixelů nebudou rozpoznány.
Vstupní data s informacemi o orientaci
Některé vstupní obrázky ve formátu JPEG můžou obsahovat informace o orientaci v metadatech EXIF (Exchangeable Image File Format). Pokud je k dispozici orientace EXIF, obrázky se před odesláním rozpoznávání tváře automaticky otočí na správnou orientaci. Obdélník tváře, orientační body a pozice hlavy pro každou rozpoznanou tvář se odhadují na základě otočného obrázku.
Pokud chcete správně zobrazit obdélník tváře a orientační body, musíte se ujistit, že je obrázek otočený správně. Většina nástrojů pro vizualizaci obrázků automaticky otočí obrázek podle orientace EXIF ve výchozím nastavení. U jiných nástrojů možná budete muset použít rotaci pomocí vlastního kódu. Následující příklady ukazují obdélník tváře na otočeném obrázku (vlevo) a ne otočený obrázek (vpravo).
Vstup videa
Pokud rozpoznáváte tváře z videokanáše, můžete zlepšit výkon úpravou určitých nastavení ve videokamerě:
Vyhlazování: Mnoho videokamerů používá vyhlazení efektu. Tuto možnost byste měli vypnout, pokud je to možné, protože vytváří rozostření mezi snímky a snižuje přehlednost.
Rychlost závěrky: Rychlejší rychlost závěrky snižuje množství pohybu mezi snímky a zpřesňuje každý snímek. Doporučujeme rychlost závěrky 1/60 sekund nebo rychlejší.
Úhel závěrky: Některé kamery místo rychlosti závěrky určují úhel závěrky. Pokud je to možné, měli byste použít nižší úhel závěru, což vede k jasnějším snímkům videa.
Poznámka:
Snímač kamery s nižším úhlem závěrky přijímá v každém snímku méně světla, takže obraz je tmavší. Potřebujete určit správnou úroveň, kterou chcete použít.
Další krok
Teď, když znáte koncepty detekce tváří, se naučíte psát skript, který rozpoznává tváře na daném obrázku.