Sdílet prostřednictvím


Trénování modelů AI a ML

V této části se dozvíte, jak trénovat modely strojového učení a AI na platformě Mosaic AI.

Trénování modelu AI v systému Mosaic zjednodušuje a sjednocuje proces trénování a nasazování tradičních modelů STROJOVÉho učení prostřednictvím úloh jemného ladění modelů AutoML a základních modelů.

AutoML

AutoML zjednodušuje proces použití strojového učení u datových sad tím, že automaticky vyhledá nejlepší algoritmus a konfiguraci hyperparametrů za vás. AutoML nabízí uživatelské rozhraní bez kódu a také rozhraní PYTHON API.

Vyladění základního modelu

Základní vyladění modelu (nyní součástí trénování modelu AI v systému Mosaic AI) v Databricks umožňuje přizpůsobit velké jazykové modely (LLM) pomocí vlastních dat. Tento proces zahrnuje vyladění trénování předem existujícího základního modelu, což výrazně snižuje objem dat, času a výpočetních prostředků požadovaných v porovnání s trénováním modelu od začátku. Mezi klíčové funkce patří:

  • Vyladění pod dohledem: Přizpůsobte si model novým úkolům trénováním na základě strukturovaných dat odpovědí na výzvy.
  • Pokračování předběžného trénování: Vylepšete model o další textová data, abyste mohli přidat nové znalosti nebo se zaměřit na konkrétní doménu.
  • Dokončení chatu: Trénování modelu v protokolech chatu za účelem zlepšení konverzačních schopností.

Příklady opensourcové knihovny

Podívejte se na příklady trénování strojového učení ze široké škály opensourcových knihoven strojového učení, včetně příkladů ladění hyperparametrů pomocí Optuna a Hyperoptu.

Hluboké učení

Podívejte se na příklady a osvědčené postupy pro distribuované trénování hlubokého učení, abyste mohli vyvíjet a vyladit modely hlubokého učení v Azure Databricks.

Doporučené osoby

Naučte se trénovat modely doporučení založené na hlubokém učení v Azure Databricks. V porovnání s tradičními modely doporučení můžou modely hlubokého učení dosáhnout vyšších výsledků kvality a škálovat na větší objemy dat.