Příklad: Sestavení a nasazení vlastní dovednosti pomocí služby Azure Machine Learning (archivováno)
Tento příklad je archivován a není podporován. Bylo vysvětleno, jak vytvořit vlastní dovednost pomocí služby Azure Machine Learning k extrakci sentimentu založeného na aspektech z recenzí. To umožňuje správně přiřazovat pozitivní a negativní mínění ve stejné revizi k identifikovaným entitům, jako jsou zaměstnanci, místnost, předsálí nebo fond.
K trénování modelu mínění založeného na aspektech ve službě Azure Machine Learning budete používat úložiště receptů nlp . Model se pak nasadí jako koncový bod v clusteru Azure Kubernetes. Po nasazení se koncový bod přidá do kanálu rozšiřování jako dovednost AML pro použití službou Cognitive Search.
K dispozici jsou dvě datové sady. Pokud chcete model vytrénovat sami, vyžaduje se soubor hotel_reviews_1000.csv. Chcete raději přeskočit krok trénování? Stáhněte si hotel_reviews_100.csv.
- Vytvoření instance služby Azure Cognitive Search
- Vytvoření pracovního prostoru Azure Machine Learning (vyhledávací služba a pracovní prostor by měly být ve stejném předplatném)
- Trénování a nasazení modelu do clusteru Azure Kubernetes
- Propojení kanálu rozšiřování AI s nasazeným modelem
- Příjem výstupu z nasazeného modelu jako vlastní funkce
Důležitý
Tato dovednost je ve verzi Public Preview v rámci doplňkových podmínek použití. Rozhraní REST API v režimu náhledu podporuje tuto dovednost.
Požadavky
- Předplatné Azure – získejte bezplatné předplatné.
- Služba Cognitive Search
- Prostředek služby Cognitive Services
- Účet služby Azure Storage)
- Pracovní prostor Azure Machine Learning
Sestava
- Naklonujte nebo stáhněte obsah ukázkového úložiště.
- Extrahujte obsah, pokud je stažený soubor zip. Ujistěte se, že soubory jsou pro čtení i zápis.
- Při nastavování účtů a služeb Azure zkopírujte názvy a klíče do snadno přístupného textového souboru. Názvy a klíče se přidají do první buňky v poznámkovém bloku, kde jsou definované proměnné pro přístup ke službám Azure.
- Pokud azure Machine Learning a její požadavky neznáte, budete si před zahájením práce chtít projít tyto dokumenty:
- Konfigurace vývojového prostředí pro službu Azure Machine Learning
- vytváření a správa pracovních prostorů Azure Machine Learning na webu Azure Portal
- Při konfiguraci vývojového prostředí pro Azure Machine Learning zvažte použití cloudové výpočetní instance, která vám usnadní zahájení práce.
- Nahrajte soubor datové sady do kontejneru v účtu úložiště. Větší soubor je nutný, pokud chcete provést krok trénování v poznámkovém bloku. Pokud chcete přeskočit trénovací krok, doporučujeme menší soubor.
Otevření poznámkového bloku a připojení ke službám Azure
- Vložte všechny požadované informace pro proměnné, které umožní přístup ke službám Azure, do první buňky a spusťte buňku.
- Spuštěním druhé buňky potvrdíte, že jste připojeni k vyhledávací službě pro vaše předplatné.
- Oddíly 1.1 – 1.5 vytvoří úložiště dat vyhledávací služby, sadu dovedností, index a indexer.
V tomto okamžiku se můžete rozhodnout přeskočit kroky pro vytvoření trénovací sady dat a experimentu ve službě Azure Machine Learning a přeskočit přímo k registraci dvou modelů, které jsou k dispozici ve složce modelů úložiště GitHub. Pokud tyto kroky přeskočíte, v poznámkovém bloku pak přejdete přímo do oddílu 3.5, Napsat skript pro hodnocení. Tím ušetříte čas; dokončení kroků stahování a nahrávání dat může trvat až 30 minut.
Vytváření a trénování modelů
Oddíl 2 obsahuje šest buněk, které stáhnou soubor s vloženou rukavicí z úložiště nlp recepty. Po stažení se soubor nahraje do úložiště dat Azure Machine Learning. Soubor .zip je přibližně 2G a provedení těchto úloh bude nějakou dobu trvat. Po nahrání se pak extrahují trénovací data a teď jste připraveni přejít k oddílu 3.
Natrénujte model mínění založený na aspektech a nasaďte váš koncový bod.
Oddíl 3 poznámkového bloku vytrénuje modely vytvořené v oddílu 2, zaregistruje je a nasadí jako koncový bod v clusteru Azure Kubernetes. Pokud azure Kubernetes neznáte, důrazně doporučujeme, abyste si před vytvořením clusteru odvozování prostudovali následující články:
- přehled služby Azure Kubernetes Service
- základních konceptů Kubernetes pro službu Azure Kubernetes Service (AKS)
- kvóty , omezení velikosti virtuálních počítačů a dostupnost oblastí ve službě Azure Kubernetes Service (AKS)
Vytvoření a nasazení clusteru odvozování může trvat až 30 minut. Před přechodem na poslední kroky se doporučuje otestovat webovou službu, aktualizovat sadu dovedností a spustit indexer.
Aktualizace sady dovedností
Část 4 v poznámkovém bloku obsahuje čtyři buňky, které aktualizují dovednostní soubor a indexovací nástroj. Alternativně můžete pomocí portálu vybrat a použít novou dovednost pro sadu dovedností a pak spustit indexer pro aktualizaci vyhledávací služby.
Na portálu přejděte do sady dovedností a vyberte odkaz Definice sady dovedností (JSON). Na portálu se zobrazí JSON sady dovedností vytvořené v prvních buňkách poznámkového bloku. Napravo od zobrazení je rozevírací nabídka, ve které můžete vybrat šablonu definice dovedností. Vyberte šablonu Azure Machine Learning (AML). zadejte název pracovního prostoru Azure ML a koncový bod modelu nasazeného do clusteru odvozování. Šablona bude aktualizována pomocí URI koncového bodu a klíče.
Zkopírujte šablonu sady dovedností z okna a vložte ji do definice sady dovedností vlevo. Upravte šablonu a zadejte chybějící hodnoty pro:
- Jméno
- Popis
- Kontext
- Název a zdroj vstupů
- Název "outputs" a "targetName"
Uložte sadu dovedností.
Po uložení sady dovedností přejděte do indexeru a vyberte odkaz Definice indexeru (JSON). Portál zobrazí JSON indexeru vytvořeného v prvních buňkách poznámkového bloku. Mapování výstupních polí bude potřeba aktualizovat dalšími mapováními polí, aby indexer mohl zpracovávat a předávat je správně. Uložte změny a pak vyberte Spustit.
Uvolnění prostředků
Když pracujete ve vlastním předplatném, je vhodné na konci projektu zjistit, jestli prostředky, které jste vytvořili, stále potřebujete. Prostředky, které zůstanou spuštěné, vás mohou stát peníze. Prostředky můžete odstranit jednotlivě nebo odstranit skupinu prostředků a odstranit tak celou sadu prostředků.
Prostředky můžete najít a spravovat na portálu pomocí odkazu Všechny prostředky nebo skupiny prostředků odkaz v levém navigačním podokně.
Pokud používáte bezplatnou službu, mějte na paměti, že jste omezeni na tři indexy, indexery a zdroje dat. Jednotlivé položky na portálu můžete odstranit, abyste zůstali pod limitem.