Sdílet prostřednictvím


Rozpoznávání objektů (verze 4.0)

Detekce objektů je podobná označování, ale rozhraní API vrací souřadnice ohraničujícího rámečku (v pixelech) pro každý objekt nalezený na obrázku. Pokud například obrázek obsahuje psa, kočku a osobu, operace detekce objektů vypíše tyto objekty s jejich souřadnicemi na obrázku. Pomocí této funkce můžete zpracovat vztahy mezi objekty na obrázku. Umožňuje také určit, jestli je na obrázku více instancí stejného objektu.

Funkce rozpoznávání objektů používá značky založené na objektech nebo živých věcech identifikovaných na obrázku. Mezi taxonomií označování a taxonomií detekce objektů neexistuje žádný formální vztah. Na koncepční úrovni funkce rozpoznávání objektů najde pouze objekty a živé věci, zatímco funkce značky může také obsahovat kontextové termíny, jako je vnitřní, které nelze lokalizovat s ohraničujícími rámečky.

Vyzkoušejte možnosti rychlého a snadného rozpoznávání objektů v prohlížeči pomocí nástroje Azure AI Vision Studio.

Příklad detekce objektů

Následující odpověď JSON ukazuje, co rozhraní API pro analýzu obrázků 4.0 vrací při zjišťování objektů v ukázkovém obrázku.

Fotografie ženy používající zařízení Microsoft Surface v kuchyni

{
    "metadata":
    {
        "width": 1260,
        "height": 473
    },
    "objectsResult":
    {
        "values":
        [
            {
                "name": "kitchen appliance",
                "confidence": 0.501,
                "boundingBox": {"x":730,"y":66,"w":135,"h":85}
            },
            {
                "name": "computer keyboard",
                "confidence": 0.51,
                "boundingBox": {"x":523,"y":377,"w":185,"h":46}
            },
            {
                "name": "Laptop",
                "confidence": 0.85,
                "boundingBox": {"x":471,"y":218,"w":289,"h":226}
            },
            {
                "name": "person",
                "confidence": 0.855,
                "boundingBox": {"x":654,"y":0,"w":584,"h":473}
            }
        ]
    }
}

Omezení

Je důležité si uvědomit omezení detekce objektů, abyste se vyhnuli nebo zmírnit účinky falešně negativních (zmeškaných objektů) a omezených podrobností.

  • Objekty se obvykle nezjistí, pokud jsou malé (méně než 5 % obrázku).
  • Objekty se obvykle nerozpoznají, pokud jsou uspořádané úzce dohromady (například zásobník plátů).
  • Objekty se nerozlišují podle názvů značek nebo produktů (různé typy sodovek na skladové polici, například). Informace o značce však můžete z obrázku získat pomocí funkce rozpoznávání značek.

Použití rozhraní API

Funkce detekce objektů je součástí rozhraní API pro analýzu obrázků. Toto rozhraní API můžete volat pomocí REST. Zahrňte Objects do parametru features dotazu. Když pak získáte úplnou odpověď JSON, parsujte řetězec pro obsah oddílu "objects" .

Další krok