Začínáme se sadou Vision Studio v Azure

Dokončeno

Pokud chcete použít službu Azure AI Vision, musíte pro ni nejprve vytvořit prostředek ve svém předplatném Azure. Můžete použít některý z následujících typů prostředků:

  • Azure AI Vision: Konkrétní prostředek pro služby vision. Tento typ prostředku použijte, pokud nemáte v úmyslu používat žádné jiné služby AI nebo pokud chcete sledovat využití a náklady na prostředek AI Vision samostatně.
  • Služby Azure AI: Obecný prostředek, který zahrnuje Azure AI Vision spolu s mnoha dalšími službami Azure AI, jako je Azure AI Language, Azure AI Speech a další. Tento typ prostředku použijte, pokud plánujete používat více služeb Azure AI a chcete zjednodušit správu a vývoj.

Jakmile vytvoříte prostředek, můžete použít rozhraní API pro čtení služby Azure AI Vision několika způsoby:

  • Vision Studio
  • REST API
  • Sady SDK (Software Development Kit): Python, C#, JavaScript

Níže se zaměříme na Vision Studio.

Azure AI Vision Studio

Azure AI Vision Studio poskytuje přístup k rozhraním API služby Azure AI Vision prostřednictvím grafického uživatelského rozhraní, které nevyžaduje kódování pro začátek.

A screenshot showing the Vision Studio interface.

Když otevřete Vision Studio, musíte vybrat výchozí prostředek. Výchozím prostředkem v nástroji Vision Studio musí být prostředek služeb Azure AI, nikoli prostředek Azure AI Vision.

Na domovské stránce sady Vision Studio můžete vybrat optické rozpoznávání znaků a extrahovat text z dlaždice obrázků a vyzkoušet modul Read OCR. Váš prostředek začne platit náklady na využití, když se použije k vrácení výsledků. Pomocí jednoho z vlastních souborů nebo ukázkového souboru můžete zjistit, jak modul Read OCR vrací zjištěné atributy. Tyto atributy odpovídají tomu, co počítač rozpozná v ohraničujících polích.

A screenshot showing the detected attributes.

Na pozadí se obrázek analyzuje pro funkce, včetně lidí, textu a objektů a označených ohraničujícími poli. Zjištěné informace se zpracovávají a výsledky se vrátí uživateli. Nezpracované výsledky se vrátí ve formátu JSON a obsahují informace o umístění ohraničujícího rámečku na stránce a rozpoznaný text. Mějte na paměti, že Vision Studio může vracet příklady OCR, ale k vytvoření vlastní aplikace OCR potřebujete pracovat se sadou SDK nebo rozhraním REST API.

A screenshot showing bounding boxes and the related json returned.