Sdílet prostřednictvím


Vyladění modelů pomocí Azure AI Foundry

Důležité

Položky označené (Preview) v tomto článku jsou aktuálně ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučujeme ji pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Vyladění odkazuje na přizpůsobení předem natrénovaného modelu AI s dodatečným trénováním pro konkrétní úlohu nebo novou datovou sadu pro lepší výkon, nové dovednosti nebo vyšší přesnost. Výsledkem je nový vlastní model GenAI, který je optimalizovaný na základě uvedených příkladů.

Zvažte vyladění modelů GenAI tak, aby:

  • Škálování a přizpůsobení se konkrétním podnikovým potřebám
  • Snížení falešně pozitivních výsledků, protože přizpůsobené modely jsou méně pravděpodobné, že produkují nepřesné nebo irelevantní odpovědi
  • Vylepšení přesnosti modelu pro úlohy specifické pro doménu
  • Úspora času a prostředků s rychlejšími a přesnějšími výsledky
  • Získání relevantnějších a kontextových výsledků, protože modely jsou jemně vyladěné pro konkrétní případy použití

Azure AI Foundry nabízí několik modelů napříč poskytovateli modelů, které umožňují získat přístup k nejnovějším a největším na trhu. Podporované modely pro doladění v našem katalogu modelů můžete zjistit pomocí filtru úloh jemného ladění a výběrem karty modelu, abyste se dozvěděli podrobné informace o jednotlivých modelech. Konkrétní modely mohou podléhat oblastním omezením. Další podrobnosti najdete v tomto seznamu.

Snímek obrazovky katalogu modelů Azure AI Foundry a filtrování podle úloh jemného ladění

Tento článek vás provede případy použití pro vyladění a způsob, jak vám to může pomoct na cestě k GenAI.

Začínáme s vyladěním

Když začínáte na cestě generující AI, doporučujeme začít s výzvou k inženýrství a RAG, abyste se seznámili se základními modely a jeho funkcemi.

  • Příprava výzvy je technika, která zahrnuje navrhování výzev pomocí tónu a podrobností stylu, příklad odpovědí a mapování záměrů pro modely zpracování přirozeného jazyka. Tento proces zlepšuje přesnost a levnost odpovědí za účelem optimalizace výkonu modelu.
  • Načítání rozšířené generace (RAG) zlepšuje výkon LLM načtením dat z externích zdrojů a začleněním do výzvy. RAG může podnikům pomoct dosáhnout přizpůsobených řešení při zachování relevance dat a optimalizaci nákladů.

Jakmile se seznámíte a začnete sestavovat řešení, je důležité pochopit, kde se rychle zrychluje technická příprava a která vám pomůže zjistit, jestli byste měli vyzkoušet jemné ladění.

  • Dochází k selhání základního modelu u hraničních případů nebo výjimek?
  • Není základní model konzistentně poskytovat výstup ve správném formátu?
  • Je obtížné přizpůsobit dostatek příkladů v kontextovém okně, aby model ztlumil?
  • Je vysoká latence?

Příklady selhání se základním modelem a technikou výzvy vám můžou pomoct identifikovat data, která se mají shromažďovat za účelem vyladění, a vytvořit standardní hodnoty výkonu, se kterými můžete model vyhodnotit a porovnat. Základní hodnoty pro výkon bez jemného ladění jsou nezbytné pro zjištění, jestli vyladění modelu zlepšuje výkon.

Tady je příklad:

Zákazník chce použít GPT-3.5 Turbo k převodu otázek v přirozeném jazyce na dotazy v konkrétním nestandardním dotazovacím jazyce. Zákazník poskytuje pokyny v příkazovém řádku ("Always Return GQL") a používá RAG k načtení schématu databáze. Syntaxe ale není vždy správná a často selže u hraničních případů. Zákazník shromažďuje tisíce příkladů otázek v přirozeném jazyce a ekvivalentních dotazů pro databázi, včetně případů, kdy model selhal dříve. Zákazník pak tato data použije k doladění modelu. Kombinace nově vyladěného modelu s navrženou výzvou a načtením přináší přesnost výstupů modelu až do přijatelných standardů pro použití.

Případy použití

Základní modely jsou už předem natrénované na obrovském množství dat a většinou do výzvy přidáte pokyny a příklady, abyste získali kvalitu odpovědí, které hledáte – tento proces se nazývá "učení s několika snímky". Vyladění umožňuje vytrénovat model s mnoha dalšími příklady, které můžete přizpůsobit konkrétnímu případu použití, a zlepšit tak učení s několika snímky. To může snížit počet tokenů v příkazovém řádku, což vede k potenciálním úsporám nákladů a požadavkům s nižší latencí.

Přeměna přirozeného jazyka na dotazovací jazyk je jen jedním z případů použití, kdy nemůžete modelu sdělit , jak se chovat. Tady je několik dalších případů použití:

  • Vylepšení zpracování načtených dat modelu
  • Model Steer pro výstup obsahu v určitém stylu, tónu nebo formátu
  • Zlepšení přesnosti při vyhledávání informací
  • Zmenšení délky výzvy
  • Učit nové dovednosti (tj. přirozený jazyk pro kódování)

Pokud jako hlavní motivátor identifikujete náklady, postupujte opatrně. Vyladění může snížit náklady na určité případy použití zkrácením výzev nebo umožněním použití menšího modelu. Na trénování ale můžou být vyšší počáteční náklady a musíte platit za hostování vlastního modelu.

Postup vyladění modelu

Tady jsou obecné kroky k vyladění modelu:

  1. V závislosti na vašem případu použití zvolte model, který podporuje váš úkol.
  2. Příprava a nahrání trénovacích dat
  3. (Volitelné) Příprava a nahrání ověřovacích dat
  4. (Volitelné) Konfigurace parametrů úkolu
  5. Trénujte model.
  6. Po dokončení zkontrolujte metriky a vyhodnoťte model. Pokud výsledky nevyhovují vašemu srovnávacímu testu, vraťte se ke kroku 2.
  7. Použití jemně vyladěného modelu

Je důležité zdůraznit, že vyladění je silně závislé na kvalitě dat, která můžete poskytnout. Osvědčeným postupem je poskytnout stovky, pokud ne tisíce příkladů trénování, aby byly úspěšné a získaly požadované výsledky.

Podporované modely pro vyladění

Teď, když víte, kdy použít jemné ladění pro váš případ použití, můžete přejít do Azure AI Foundry a najít modely, které jsou k dispozici k vyladění. U některých modelů v katalogu modelů je k dispozici vyladění pomocí bezserverového rozhraní API nebo spravovaného výpočetního prostředí (Preview) nebo obojího.

Vyladění je k dispozici v konkrétních oblastech Azure pro některé modely nasazené prostřednictvím bezserverových rozhraní API. Aby bylo možné tyto modely vyladit, musí mít uživatel centrum/projekt v oblasti, ve které je model k dispozici pro vyladění. Podrobné informace najdete v tématu Dostupnost oblastí pro modely v koncových bodech bezserverového rozhraní API.

Další informace o vyladění pomocí spravovaného výpočetního prostředí (Preview) najdete v tématu Vyladění modelů pomocí spravovaného výpočetního prostředí (Preview).

Podrobnosti o modelech Azure OpenAI, které jsou k dispozici pro vyladění, najdete v dokumentaci k modelům služby Azure OpenAI nebo tabulce modelů Azure OpenAI dále v této příručce.

Mezi modely služby Azure OpenAI, které můžete doladit, patří podporované oblasti pro vyladění oblastí USA – středosever, Švédsko – střed a další.

Vyladění modelů Azure OpenAI

Poznámka:

gpt-35-turbo – Vyladění tohoto modelu je omezené na podmnožinu oblastí a není k dispozici v každé oblasti, ve které je základní model k dispozici.

Podporované oblasti pro vyladění se můžou lišit, pokud používáte modely Azure OpenAI v projektu Azure AI Foundry a ne mimo projekt.

ID modelu Vyladění oblastí Maximální počet požadavků (tokeny) Trénovací data (až do)
babbage-002 USA – středosever
Švédsko – střed
Švýcarsko – západ
16,384 Zář 2021
davinci-002 USA – středosever
Švédsko – střed
Švýcarsko – západ
16,384 Zář 2021
gpt-35-turbo (0613) USA – východ 2
USA – středosever
Švédsko – střed
Švýcarsko – západ
4,096 Zář 2021
gpt-35-turbo (1106) USA – východ 2
USA – středosever
Švédsko – střed
Švýcarsko – západ
Vstup: 16 385
Výstup: 4 096
Zář 2021
gpt-35-turbo (0125) USA – východ 2
USA – středosever
Švédsko – střed
Švýcarsko – západ
16,385 Zář 2021
gpt-4 (0613) 1 USA – středosever
Švédsko – střed
8192 Zář 2021
gpt-4o-mini (2024-07-18) USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 64 536
Října 2023
gpt-4o (2024-08-06) USA – východ 2
USA – středosever
Švédsko – střed
Vstup: 128 000
Výstup: 16 384
Délka kontextu příkladu trénování: 64 536
Října 2023

1 GPT-4 je aktuálně ve verzi Public Preview.