Sdílet prostřednictvím


Vyladění modelů Phi-3 na portálu Azure AI Foundry

Důležité

Položky označené (Preview) v tomto článku jsou aktuálně ve verzi Public Preview. Tato verze Preview je poskytována bez smlouvy o úrovni služeb a nedoporučujeme ji pro produkční úlohy. Některé funkce se nemusí podporovat nebo mohou mít omezené možnosti. Další informace najdete v dodatečných podmínkách použití pro verze Preview v Microsoft Azure.

Azure AI Foundry umožňuje přizpůsobit velké jazykové modely vašim osobním datovým sadám pomocí procesu označovaného jako jemné ladění. Jemné ladění poskytuje významnou hodnotu tím, že umožňuje přizpůsobení a optimalizaci pro konkrétní úlohy a aplikace. Vede ke zlepšení výkonu, efektivity nákladů, snížení latence a přizpůsobených výstupů.

V tomto článku se naučíte vyladit řadu malých jazykových modelů (SLM) phi-3 na portálu Azure AI Foundry jako službu s průběžnými platbami.

Řada SLM Phi-3 je kolekce vygenerovaných generovacích textových modelů vyladěných instrukcemi. Modely Phi-3 jsou nejschopnější a nákladově efektivní malé jazykové modely (SLM), které jsou k dispozici, výkon modelů stejné velikosti a další velikosti v různých jazycích, důvodech, kódování a matematických srovnávacích testech.

Důležité

Modely, které jsou ve verzi Preview, jsou na kartách modelu v katalogu modelů označené jako náhled .

Phi-3 Mini je 3,8B parametry, jednoduchý, nejmodernější otevřený model založený na datových sadách používaných pro Phi-2 - syntetická data a filtrované weby - se zaměřením na vysoce kvalitní a zdůvodnění hustých dat. Model patří do rodiny modelů Phi-3 a verze Mini je ve dvou variantách 4K a 128 K, což je délka kontextu (v tokenech), kterou může podporovat.

Model prošel důkladným procesem vylepšení, který zahrnuje optimalizaci jemného ladění pod dohledem a přímou optimalizaci předvoleb, aby se zajistilo přesné dodržování instrukcí a robustní bezpečnostní opatření. Při posuzování srovnávacích testů, které testují běžný smysl, porozumění jazyku, matematiku, kód, dlouhý kontext a logické odůvodnění, Phi-3 Mini-4K-Instruct a Phi-3 Mini-128K-Instruct předvádějí robustní a nejmodernější výkon mezi modely s méně než 13 miliardami parametrů.

Požadavky

  • Předplatné Azure. Pokud nemáte předplatné Azure, vytvořte si placený účet Azure, abyste mohli začít.

  • Centrum Azure AI Foundry

    Důležité

    U modelů rodiny Phi-3 je nabídka modelu s průběžnými platbami dostupná pouze u center vytvořených v oblastech USA – východ 2 .

  • Projekt Azure AI Foundry

  • Řízení přístupu na základě role v Azure (Azure RBAC) se používá k udělení přístupu k operacím na portálu Azure AI Foundry. Pokud chcete provést kroky v tomto článku, musí být vašemu uživatelskému účtu přiřazena role Vývojář Azure AI ve skupině prostředků.

    Další informace o oprávněních najdete v tématu Řízení přístupu na základě role na portálu Azure AI Foundry.

Registrace poskytovatele předplatného

Ověřte, že je předplatné zaregistrované u Microsoft.Network poskytovatele prostředků.

  1. Přihlaste se k portálu Azure.
  2. V nabídce vlevo vyberte Předplatná .
  3. Vyberte předplatné, které chcete použít.
  4. V nabídce vlevo vyberte zprostředkovatele prostředků nastavení>.
  5. Ověřte, že microsoft.Network je v seznamu poskytovatelů prostředků. V opačném případě ho přidejte.

Příprava dat

Připravte trénovací a ověřovací data pro vyladění modelu. Vaše cvičební data a sady ověřovacích dat se skládají ze vstupních a výstupních příkladů toho, jak se má model provádět.

Ujistěte se, že všechny trénovací příklady dodržují očekávaný formát pro odvozování. Pokud chcete modely efektivně vyladit, zajistěte vyváženou a různorodou datovou sadu.

To zahrnuje udržování rovnováhy dat, včetně různých scénářů, a pravidelné zpřesnění trénovacích dat tak, aby odpovídala očekáváním reálného světa, což nakonec vede k přesnějším a vyváženějším odpovědím modelu.

Různé typy modelů vyžadují jiný formát trénovacích dat.

Dokončení chatu

Použitá trénovací a ověřovací data musí být naformátovaná jako dokument JSON Lines (JSONL). Pro Phi-3-mini-128k-instruct jemně vyladěnou datovou sadu musí být formátovaná v konverzačním formátu, který používá rozhraní API pro dokončování chatu.

Příklad formátu souboru

    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Is Xbox better than PlayStation?"}, {"role": "assistant", "content": "I apologize, but I cannot provide personal opinions. My primary job is to assist you with any issues related to your Xbox device. Do you have any Xbox-related issues that need addressing?"}]}
    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "Can I play PC games on my Xbox?"}, {"role": "assistant", "content": "While Xbox consoles don't natively support PC games, they can play an array of Xbox games, many of which are also available on PC. Can I assist you with finding games compatible with your Xbox device?"}]}
    {"messages": [{"role": "system", "content": "You are an Xbox customer support agent whose primary goal is to help users with issues they are experiencing with their Xbox devices. You are friendly and concise. You only provide factual answers to queries, and do not provide answers that are not related to Xbox."}, {"role": "user", "content": "I'm having trouble connecting my Xbox to the Wi-Fi."}, {"role": "assistant", "content": "No worries, let's go through the network settings on your Xbox. Can you please tell me what happens when you try to connect it to the Wi-Fi?"}]}

Podporovaný typ souboru je řádky JSON. Soubory se nahrají do výchozího úložiště dat a zpřístupní se v projektu.

Vyladění modelu Phi-3

Vyladění modelu Phi-3:

  1. Přihlaste se k Azure AI Foundry.

  2. Vyberte model, který chcete vyladit z katalogu modelů portálu Azure AI Foundry.

  3. Na stránce Podrobnosti modelu vyberte jemně vyladit.

  4. Vyberte projekt, ve kterém chcete modely vyladit. Pokud chcete použít nabídku modelu průběžných plateb, musí váš pracovní prostor patřit do oblasti USA – východ 2 .

  5. V průvodci doladěním vyberte odkaz na podmínky Azure AI Foundry, kde najdete další informace o podmínkách použití. Můžete také vybrat kartu podrobností nabídky Azure AI Foundry, kde se dozvíte o cenách vybraného modelu.

  6. Pokud model v projektu poprvé vyladíte, musíte se přihlásit k odběru konkrétní nabídky (například Phi-3-mini-128k-instruct) z Azure AI Foundry. Tento krok vyžaduje, aby váš účet má oprávnění předplatného Azure a oprávnění skupiny prostředků uvedená v požadavcích. Každý projekt má vlastní předplatné konkrétní nabídky Azure AI Foundry, která umožňuje řídit a monitorovat útraty. Vyberte Přihlásit se k odběru a dolaďte je.

    Poznámka:

    Přihlášení k odběru projektu konkrétní nabídce Azure AI Foundry (v tomto případě Phi-3-mini-128k-instruct) vyžaduje, aby váš účet získal přístup přispěvatele nebo vlastníka na úrovni předplatného, kde se projekt vytvořil. Případně můžete svému uživatelskému účtu přiřadit vlastní roli, která má oprávnění předplatného Azure a oprávnění skupiny prostředků uvedená v požadavcích.

  7. Jakmile si zaregistrujete projekt pro konkrétní nabídku Azure AI Foundry, následné vyladění stejné nabídky ve stejném projektu nevyžaduje opětovné přihlášení k odběru. Proto nemusíte mít oprávnění na úrovni předplatného pro následné úlohy vyladit. Pokud se tento scénář týká vás, vyberte Pokračovat a vyladit ho.

  8. Zadejte název jemně vyladěného modelu a volitelné značky a popis.

  9. Výběrem trénovacích dat model vyladíte. Další informace najdete v přípravě dat.

    Poznámka:

    Pokud máte vaše trénovací/ověřovací soubory v úložišti dat méně přihlašovacích údajů, budete muset povolit přístup spravované identity pracovního prostoru k úložišti dat, aby bylo možné pokračovat v vyladění MaaS s méně přihlašovacími údaji. Na stránce Úložiště dat po kliknutí na Aktualizovat ověřování > vyberte následující možnost:

    Použijte spravovanou identitu pracovního prostoru pro náhled dat a profilaci v studio Azure Machine Learning.

    Ujistěte se, že všechny trénovací příklady dodržují očekávaný formát pro odvozování. Pokud chcete modely efektivně vyladit, zajistěte vyváženou a různorodou datovou sadu. To zahrnuje udržování rovnováhy dat, včetně různých scénářů, a pravidelné zpřesnění trénovacích dat tak, aby odpovídala očekáváním reálného světa, což nakonec vede k přesnějším a vyváženějším odpovědím modelu.

    • Velikost dávky, která se má použít pro trénování. Při nastavení na hodnotu -1 se batch_size vypočítá jako 0,2 % příkladů v trénovací sadě a maximální hodnota je 256.
    • Mírná míra učení je původní míra učení používaná pro předtrénování vynásobenou tímto násobitelem. Doporučujeme experimentovat s hodnotami mezi 0,5 a 2. Empiricky jsme zjistili, že větší míry učení často fungují lépe s většími velikostmi dávek. Musí být v rozsahu 0,0 až 5.0.
    • Počet epoch trénování. Epocha odkazuje na jeden úplný cyklus prostřednictvím datové sady.
  10. Parametry úloh jsou volitelný krok a pokročilá možnost – Ladění hyperparametrů je nezbytné pro optimalizaci velkých jazykových modelů (LLM) v reálných aplikacích. Umožňuje zvýšit výkon a efektivní využití prostředků. Uživatelé se můžou rozhodnout zachovat výchozí nastavení nebo pokročilí uživatelé můžou přizpůsobit parametry, jako jsou epochy nebo rychlost učení.

  11. Zkontrolujte výběry a pokračujte v trénování modelu.

Jakmile je model jemně vyladěný, můžete ho nasadit a použít ho ve vlastní aplikaci, na hřišti nebo v příkazovém toku. Další informace najdete v tématu Nasazení řady phi-3 velkých jazykových modelů pomocí Azure AI Foundry.

Čištění jemně vyladěných modelů

Jemně vyladěný model můžete odstranit ze seznamu jemně vyladěných modelů v Azure AI Foundry nebo na stránce s podrobnostmi modelu. Vyberte jemně vyladěný model, který chcete odstranit ze stránky Jemné ladění, a pak výběrem tlačítka Odstranit odstraňte jemně vyladěný model.

Poznámka:

Pokud má existující nasazení, nemůžete odstranit vlastní model. Před odstraněním vlastního modelu musíte nejprve odstranit nasazení modelu.

Náklady a kvóty

Důležité informace o nákladech a kvótách pro modely Phi vyladěné jako služba

Modely Phi jsou jemně vyladěné jako služba, které nabízí Microsoft a je integrovaný s Azure AI Foundry pro použití. Ceny najdete při nasazování nebo vyladění modelů na kartě Ceny a podmínky v průvodci nasazením.

Ukázkový poznámkový blok

Pomocí tohoto ukázkového poznámkového bloku můžete vytvořit samostatnou úlohu vyladění, která vylepšuje schopnost modelu shrnout dialogy mezi dvěma lidmi pomocí datové sady Samsum. Využitá trénovací data jsou datová sada ultrachat_200k, která je rozdělená do čtyř rozdělení vhodných pro vyladění pod dohledem (sft) a pořadí generování (gen). Poznámkový blok využívá dostupné modely Azure AI pro úlohu dokončení chatu (pokud chcete použít jiný model, než jaký se v poznámkovém bloku používá, můžete název modelu nahradit). Poznámkový blok zahrnuje nastavení požadavků, výběr modelu pro vyladění, vytvoření trénovacích a ověřovacích datových sad, konfiguraci a odeslání úlohy jemného ladění a nakonec vytvoření bezserverového nasazení pomocí jemně vyladěného modelu pro odvozování vzorků.

Filtrování obsahu

Modely nasazené jako služba s průběžnými platbami jsou chráněné službou Azure AI Content Safety. Když se nasadí do koncových bodů v reálném čase, můžete se z této funkce odhlásit. S povolenou bezpečností obsahu Azure AI prochází výzva i dokončení souborem klasifikačních modelů určených k detekci a zabránění výstupu škodlivého obsahu. Systém filtrování obsahu (Preview) detekuje a provádí akce s konkrétními kategoriemi potenciálně škodlivého obsahu ve vstupních výzev i dokončení výstupu. Přečtěte si další informace o bezpečnosti obsahu Azure AI.

Další kroky