Vytvoření vlastního projektu
K vytvoření vlastního modelu Azure AI Vision potřebujete nejprve prostředek azure AI Services (nebo prostředek Azure AI Vision). Jakmile se tento prostředek nasadí do vašeho předplatného, musíte vytvořit vlastní projekt.
Komponenty vlastního projektu Vision
První komponentou vlastního projektu je datová sada. Datová sada je vaše kolekce obrázků, které se mají použít při trénování modelu, spolu se souborem COCO, který definuje informace o popiscích těchto obrázků. Vaše datová sada je uložená v kontejneru úložiště objektů blob v Azure a v této lekci se budeme zabývat dalšími informacemi o souboru COCO.
Jakmile budete mít definované obrázky a popisky tříd, můžete vytrénovat vlastní model. Při trénování modelu zadáte typ modelu, který se má vytrénovat, kterou datovou sadu použít, a rozpočet trénování (v čase). Po dokončení trénování modelu můžete zobrazit výkon a použít model pro předpovědi.
Ve většině případů jsou následující kroky:
- Vytvořte kontejner úložiště objektů blob a nahrajte jenom trénovací obrázky.
- Vytvořte datovou sadu pro váš projekt a připojte ji k kontejneru úložiště objektů blob. Při vytváření datové sady definujete, o jaký typ projektu se jedná (klasifikace obrázků, detekce objektů nebo rozpoznávání produktů).
- Označte data v projektu popisování dat v Azure Machine Učení, který vytvoří soubor COCO v kontejneru úložiště objektů blob.
- Připojení dokončený soubor COCO pro označené obrázky do vaší datové sady.
- Trénujte vlastní model na vytvořené datové sadě a popiscích.
- Ověřte výkon a iterujte, pokud trénovaný výkon nesplňuje očekávání.
Jakmile budete s výkonem spokojení, můžete model použít v nástroji Vision Studio nebo ve vlastní aplikaci.
Soubory COCO
Soubor COCO je soubor JSON s konkrétním formátem, který definuje:
- obrázky: Definuje umístění obrázku v úložišti objektů blob, názvu, šířce, výšce a ID.
- poznámky: Definuje klasifikace (nebo objekty), včetně kategorie, jako je obrázek klasifikovaný jako, oblast a ohraničující rámeček (pokud popisek pro detekci objektů).
- categories: Definuje ID pro pojmenovanou třídu popisků.
Ve většině případů se soubory COCO vytvářejí popisky trénovacích obrázků v projektu popisků dat ve službě Azure Machine Učení. Pokud migrujete ze starého projektu Custom Vision, můžete pomocí skriptu migrace vytvořit soubor COCO.
Ukázkový soubor COCO vypadá takto:
{
"images": [
{
"id": 1,
"width": 1024,
"height": 768,
"file_name": "abc.jpg",
"coco_url": "AmlDatastore://fruit/abc.jpg",
"absolute_url": "https://myBlobStorage.blob.core.windows.net/fruit/abc.jpg",
"date_captured": "<date>"
},
{
"id": 2,
"width": 1024,
"height": 768,
"file_name": "xyz.jpg",
"coco_url": "AmlDatastore://fruit/xyz.jpg",
"absolute_url": "https://myBlobStorage.blob.core.windows.net/fruit/xyz.jpg",
"date_captured": "<date>"
},
<...>
],
"annotations": [
{
"id": 1,
"category_id": 1,
"image_id": 1,
"area": 0.0
},
{
"id": 2,
"category_id": 1,
"image_id": 2,
"area": 0.0
},
<...>
],
"categories": [
{
"id": 1,
"name": "apple"
},
{
"id": 2,
"name": "orange"
},
{
"id": 3,
"name": "banana"
}
]
}
Pokud označujete datovou sadu detekce objektů, každá poznámka v souboru COCO obsahuje také ohraničující pole s hodnotami v poli Vlevo, Nahoře, Šířka a Výška.
"bbox": [
0.11803319477782331,
0.41586723392402375,
0.7765206955096307,
0.3483334397217212
]
Vytvoření datové sady
Jakmile budete mít obrázky v kontejneru úložiště objektů blob, můžete datovou sadu vytvořit pro trénování pomocí rozhraní REST API nebo pomocí sady Vision Studio. Požadavek REST by byl podobný následujícímu volání REST:
curl -X PUT https://<endpoint>/computervision/datasets/<dataset-name>?api-version=<version>\
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <subscription-key>" \
--data-ascii "
{
'annotationKind':'imageClassification',
'annotationFileUris':['<URI>']
}"
Pokud používáte Vision Studio, přejděte na dlaždici vlastního modelu, vyberte prostředek a vytvořte datovou sadu. Odtud můžete otevřít nebo vytvořit projekt popisování dat Učení azure machine nebo nahrát existující soubor COCO. Cvičení v tomto modulu vás provede procesem vytvoření datové sady tímto způsobem.
Pomocí nástroje Vision Studio se můžete připojit k projektu popisování v Azure Machine Učení místo zadání souboru COCO v požadavku REST. Zbývající příklady v tomto modulu používají Vision Studio, ale pokud je upřednostňovaným příkladem metody REST, jsou k dispozici na stránkách dokumentace.