Sdílet prostřednictvím


Používání modelů Open Source foundation kurátorovaných službou Azure Machine Learning

V tomto článku se dozvíte, jak v katalogu modelů doladit, vyhodnotit a nasadit základní modely.

Jakýkoli předem natrénovaný model můžete rychle otestovat pomocí formuláře Ukázkové odvozování na kartě modelu a zadat vlastní ukázkový vstup k otestování výsledku. Kromě toho karta modelu pro každý model obsahuje stručný popis modelu a odkazy na ukázky pro odvozování založené na kódu, vyladění a vyhodnocení modelu.

Jak vyhodnotit základní modely pomocí vlastních testovacích dat

Základní model můžete vyhodnotit pro testovací datovou sadu pomocí formuláře Vyhodnotit uživatelské rozhraní nebo pomocí ukázek založených na kódu, které jsou propojené z karty modelu.

Vyhodnocení pomocí studia

Formulář Vyhodnotit model můžete vyvolat výběrem tlačítka Vyhodnotit na kartě modelu pro libovolný základní model.

Snímek obrazovky znázorňující formulář nastavení vyhodnocení po výběru tlačítka vyhodnocení na kartě modelu pro základní model

Každý model lze vyhodnotit pro konkrétní úlohu odvozování, pro kterou se model použije.

Testovací data:

  1. Předejte testovací data, která chcete použít k vyhodnocení modelu. Můžete buď nahrát místní soubor (ve formátu JSONL), nebo vybrat existující registrovanou datovou sadu z vašeho pracovního prostoru.
  2. Po výběru datové sady je potřeba namapovat sloupce ze vstupních dat na základě schématu potřebného pro úkol. Například namapujte názvy sloupců, které odpovídají klíčům "věta" a "label" pro klasifikaci textu.

Snímek obrazovky znázorňující mapu vyhodnocení ve formuláři vyhodnocení základních modelů

Výpočty:

  1. Zadejte výpočetní cluster Azure Machine Learning, který chcete použít k vyladění modelu. Vyhodnocení musí běžet na výpočetních prostředcích GPU. Ujistěte se, že máte dostatečnou kvótu výpočetních prostředků pro výpočetní skladové položky, které chcete použít.

  2. Výběrem možnosti Dokončit ve formuláři Vyhodnocení odešlete úlohu vyhodnocení. Po dokončení úlohy můžete zobrazit metriky vyhodnocení modelu. Na základě metrik vyhodnocení se můžete rozhodnout, jestli chcete model vyladit pomocí vlastních trénovacích dat. Kromě toho se můžete rozhodnout, jestli chcete model zaregistrovat a nasadit ho do koncového bodu.

Vyhodnocení pomocí ukázek založených na kódu

Abychom uživatelům umožnili začít s vyhodnocením modelu, publikovali jsme ukázky (jak poznámkové bloky Pythonu, tak příklady rozhraní příkazového řádku) v tématu Ukázky vyhodnocení v úložišti Git azureml-examples. Každá karta modelu také odkazuje na ukázky vyhodnocení pro odpovídající úlohy

Vyladění základních modelů pomocí vlastních trénovacích dat

Pokud chcete zlepšit výkon modelu ve vaší úloze, můžete chtít základní model doladit pomocí vlastních trénovacích dat. Tyto základní modely můžete snadno vyladit pomocí nastavení jemného ladění v sadě studio nebo pomocí ukázek založených na kódu, které jsou propojené z karty modelu.

Vyladění pomocí studia

Formulář nastavení jemného ladění můžete vyvolat tak, že vyberete tlačítko Doladit na kartě modelu pro libovolný základní model.

Vyladění nastavení:

Snímek obrazovky znázorňující možnosti nastavení jemného ladění základních modelů ve formuláři nastavení

Typ úlohy jemného ladění

  • Každý předem natrénovaný model z katalogu modelů je možné doladit pro určitou sadu úkolů (například klasifikace textu, klasifikace tokenu, odpověď na otázky). V rozevíracím seznamu vyberte úkol, který chcete použít.

Trénovací data

  1. Předejte trénovací data, která chcete použít k vyladění modelu. Můžete buď nahrát místní soubor (ve formátu JSONL, CSV nebo TSV), nebo vybrat existující registrovanou datovou sadu z vašeho pracovního prostoru.

  2. Po výběru datové sady je potřeba namapovat sloupce ze vstupních dat na základě schématu potřebného pro úkol. Příklad: mapování názvů sloupců, které odpovídají klíčům "věta" a "label" pro klasifikaci textu

Snímek obrazovky znázorňující mapu v průvodci vyhodnocením základních modelů

  • Ověřovací data: Předejte data, která chcete použít k ověření modelu. Výběrem možnosti Automatické rozdělení se automaticky rozdělí trénovací data pro ověření. Případně můžete zadat jinou ověřovací datovou sadu.
  • Testovací data: Předejte testovací data, která chcete použít k vyhodnocení jemně vyladěného modelu. Výběrem možnosti Automatické rozdělení se automaticky rozdělí trénovací data pro testování.
  • Compute: Zadejte výpočetní cluster Azure Machine Learning, který chcete použít k vyladění modelu. Jemné ladění musí běžet na výpočetních prostředcích GPU. Při vyladění doporučujeme používat skladové položky výpočetních prostředků s grafickými procesory A100 / V100. Ujistěte se, že máte dostatečnou kvótu výpočetních prostředků pro výpočetní skladové položky, které chcete použít.
  1. Výběrem možnosti Dokončit ve formuláři pro vyladění odešlete úlohu jemného ladění. Po dokončení úlohy můžete zobrazit metriky vyhodnocení pro jemně vyladěný model. Výstup jemně vyladěného modelu pak můžete zaregistrovat pomocí úlohy vyladění a nasadit tento model do koncového bodu pro odvozování.

Vyladění pomocí ukázek založených na kódu

Azure Machine Learning v současné době podporuje vyladění modelů pro následujících úloh jazyka:

  • Klasifikace textu
  • Klasifikace tokenů
  • Odpovídání na dotazy
  • Souhrn
  • Překlad

Abychom uživatelům umožnili rychle začít s vyladěním, publikovali jsme ukázky (jak poznámkové bloky Pythonu, tak příklady rozhraní příkazového řádku) pro každou úlohu v ukázkách Git Finetune v úložišti Azureml-examples. Každá karta modelu také odkazuje na ukázky vyladění podporovaných úloh vyladění.

Nasazení základních modelů do koncových bodů pro odvozování

Základní modely (předem natrénované modely z katalogu modelů a jemně vyladěné modely, jakmile jsou zaregistrované do vašeho pracovního prostoru) můžete nasadit do koncového bodu, který se pak dá použít k odvozování. Nasazení do bezserverových rozhraní API i spravovaných výpočetních prostředků se podporuje. Tyto modely můžete nasadit pomocí průvodce nasazením uživatelského rozhraní nebo pomocí ukázek založených na kódu, které jsou propojené z karty modelu.

Nasazení pomocí studia

Formulář Nasadit uživatelské rozhraní můžete vyvolat tak , že vyberete tlačítko Nasadit na kartě modelu pro libovolný základní model a vyberete bezserverové rozhraní API s bezpečností obsahu Azure AI nebo spravovanými výpočetními prostředky bez zabezpečení obsahu Azure AI.

Snímek obrazovky znázorňující tlačítko Nasadit na základní kartě modelu

Nastavení nasazení

Vzhledem k tomu, že bodovací skript a prostředí jsou automaticky součástí základního modelu, stačí zadat skladovou položku virtuálního počítače, která se má použít, počet instancí a název koncového bodu pro nasazení.

Snímek obrazovky znázorňující možnosti nasazení na základní kartě modelu poté, co uživatel vybere tlačítko Nasadit

Sdílená kvóta

Pokud nasazujete model Llama-2, Phi, Nemotron, Mistral, Dolly nebo Deci-DeciLM z katalogu modelů, ale nemáte k dispozici dostatečnou kvótu pro nasazení, Azure Machine Learning umožňuje používat kvótu ze sdíleného fondu kvót po omezenou dobu. Další informace o sdílené kvótě najdete v tématu Sdílená kvóta služby Azure Machine Learning.

Snímek obrazovky znázorňující možnost dočasného nasazení modelu Llama pomocí sdílené kvóty

Nasazení pomocí ukázek založených na kódu

Abychom uživatelům umožnili rychle začít s nasazením a odvozováním, publikovali jsme ukázky v ukázkách odvozování v úložišti azureml-examples git. Publikované ukázky zahrnují poznámkové bloky Pythonu a příklady rozhraní příkazového řádku. Každá karta modelu také odkazuje na ukázky odvozování v reálném čase a dávkové odvozování.

Import základních modelů

Pokud chcete použít opensourcový model, který není součástí katalogu modelů, můžete model importovat z Hugging Face do pracovního prostoru Azure Machine Learning. Hugging Face je opensourcová knihovna pro zpracování přirozeného jazyka (NLP), která poskytuje předem nacvičené modely pro oblíbené úlohy NLP. Import modelu v současné době podporuje import modelů pro následující úlohy, pokud model splňuje požadavky uvedené v poznámkovém bloku importu modelu:

  • maska výplně
  • klasifikace tokenů
  • odpovídání na dotazy
  • souhrn
  • generování textu
  • klasifikace textu
  • Překlad
  • klasifikace obrázku
  • text-na-obrázek

Poznámka:

Modely z Hugging Face podléhají licenčním podmínkám třetích stran, které jsou k dispozici na stránce podrobností modelu Hugging Face. Je vaší zodpovědností dodržovat licenční podmínky modelu.

Pokud chcete použít poznámkový blok importu modelu, můžete vybrat tlačítko Importovat v pravém horním rohu katalogu modelů.

Snímek obrazovky znázorňující tlačítko importu modelu, které se zobrazuje v pravém horním rohu základního katalogu modelů

Poznámkový blok pro import modelu je také součástí úložiště Git s příklady azureml zde.

Pokud chcete model importovat, musíte předat MODEL_ID model, který chcete importovat z Hugging Face. Projděte si modely v centru Hugging Face a identifikujte model, který chcete importovat. Ujistěte se, že typ úlohy modelu patří mezi podporované typy úloh. Zkopírujte ID modelu, které je k dispozici v identifikátoru URI stránky nebo lze zkopírovat pomocí ikony kopírování vedle názvu modelu. Přiřaďte ji k proměnné MODEL_ID v poznámkovém bloku importu modelu. Příklad:

Snímek obrazovky znázorňující příklad ID modelu tváře ('bert-base-uncased'), jak se zobrazuje na stránce dokumentace k modelu objetí tváře

Musíte poskytnout výpočetní prostředky pro spuštění importu modelu. Spuštění importu modelu způsobí import zadaného modelu z Hugging Face a zaregistruje se do pracovního prostoru Služby Azure Machine Learning. Pak můžete tento model doladit nebo ho nasadit do koncového bodu pro odvozování.

Další informace