Doporučení pro správu pro úlohy AI v Azure
Tento článek nabízí doporučení pro správu pro organizace, které provozují úlohy AI v Azure. Zaměřuje se na řešení Azure AI typu platforma jako služba (PaaS), včetně Služeb Azure AI Foundry, Azure OpenAI, Azure Machine Learning a Azure AI Services. Zahrnuje úlohy generující i negenerativní umělé inteligence.
Efektivní správa úloh AI v Azure zahrnuje dohled nad nasazením, výkonem modelu, provozem, daty a zotavením po havárii za účelem podpory úloh AI. Správná správa pomáhá zajistit, aby byly úlohy umělé inteligence spolehlivé, důvěryhodné a zabezpečené v průběhu jejich životního cyklu.
Správa nasazení AI
Správa nasazení AI pomáhá týmům úloh přecházet z fází testování konceptu do produkčních prostředí s konzistentními konfiguracemi, které zlepšují zabezpečení a dodržování předpisů napříč týmy. Azure nabízí nástroje, jako je Azure AI Foundry Hubs a projekty, k vynucování zásad správného řízení a zabezpečení. Azure Machine Learning má podobné funkce s pracovními prostory centra. Další informace najdete v tématu Správa nasazení AI.
Správa modelů AI
Správa modelů AI zahrnuje monitorování výstupů, výkonu a souladu s principy zodpovědné umělé inteligence. Modely AI se můžou v průběhu času měnit data, chování uživatelů nebo jiné externí faktory. Tyto změny můžou vést k nepřesným výsledkům nebo etickým obavám, pokud nejsou vyřešeny.
Monitorujte výstupy modelu. Implementujte proces monitorování a testování, abyste zajistili, že tyto úlohy zůstanou v souladu s vašimi zodpovědnými cíli umělé inteligence.
Monitorujte generování umělé inteligence. Pro úlohy generativní AI použijte vestavěné vyhodnocení a možnosti ručního monitorování Azure AI Foundry. Pokud používáte tok výzvy, monitorujte nasazení toku výzvy. Zvažte také použití zodpovědných nástrojů AI k doplnění monitorování modelů.
Monitorujte negenerativní AI. V případě negenerativních úloh umělé inteligence monitorujte fáze zpracování dat a metriky výkonu modelu, abyste zajistili, že předpovědi zůstanou přesné a spolehlivé. Povolení monitorování modelů ve službě Azure Machine Learning U služeb Azure AI povolte monitorování pro každou službu AI, kterou používáte.
Monitorování výkonu modelu Při zjištění poklesu výkonu nebo přesnosti pomáhá monitorování určit zdroj problému. Stejně jako u všech úloh můžete pomocí služby Azure Monitor a Application Insights monitorovat výkon úloh AI.
Monitorujte výkon generující umělé inteligence. V generivní umělé inteligenci monitorujte latenci v době odezvy nebo přesnost výsledků vektorového hledání za účelem vylepšení uživatelského prostředí. V Azure AI Foundry povolte trasování ke shromažďování dat trasování pro každý požadavek, agregovaných metrik a zpětné vazby uživatelů.
Monitorování negenerativního výkonu AI Zachytávání metrik výkonu modelů nasazených ve službě Azure Machine Learning U služeb Azure AI povolte protokolování diagnostiky pro každou službu Azure AI.
Zvažte generování brány AI pro monitorování. Reverzní proxy server, jako je Azure API Management, umožňuje implementovat protokolování a monitorování, které nejsou nativní pro platformu. API Management umožňuje shromažďovat zdrojové IP adresy, vstupní text a výstupní text. Další informace najdete v tématu Implementace protokolování a monitorování pro jazykové modely služby Azure OpenAI Service.
Správa operací AI
Správa provozu AI zahrnuje standardizaci výpočetních prostředků a monitorování prostředků platformy pro úlohy Azure AI. Zajišťuje, aby týmy efektivně používaly správné výpočetní prostředky a zaznamenávaly metriky a protokoly z prostředků platformy.
Monitorování prostředků platformy Pomocí nastavení diagnostiky můžete zaznamenávat protokoly a metriky pro všechny klíčové služby, jako je Azure AI Foundry, azure Machine Learninga služby Azure AI. Konkrétní služby by měly zaznamenávat protokoly auditu a relevantní protokoly specifické pro službu. Implementujte vlastní výstrahy monitorování na základě konkrétních potřeb vaší architektury. Mezi příklady patří upozornění pro registry kontejnerů, Azure Machine Learning a Azure OpenAI. Nakonfigurujte doporučená upozornění monitorování pro každou službu v architektuře AI. Další informace najdete v tématu standardní upozornění služby Azure Monitor.
Standardizace správy výpočetních prostředků. Pro určité akce, jako jsou toky výzvy a trénovací modely, potřebujete výpočetní prostředky. Služba, jako je Machine Learning, má různé výpočetní možnosti, jako jsou výpočetní instance, clustery a bezserverové možnosti. Standardizujte výpočetní typ, moduly runtime a období vypnutí. Informace o možnostech výpočetních prostředků specifických pro službu najdete v tématu Azure AI Foundry a Machine Learning.
Správa dat AI
Vysoce kvalitní data jsou základem přesných modelů AI. Posun modelu sledování pomáhá udržovat v průběhu času relevanci předpovědí umělé inteligence a umožňuje organizacím přizpůsobit modely podle potřeby tak, aby odrážely aktuální podmínky.
Monitorování posunu dat Sledujte přesnost a posun dat nepřetržitě ve generativní a negenerativní umělé inteligenci, abyste zajistili, že modely zůstanou relevantní. Monitorování vás může upozornit, když se predikce modelu nebo odpovědi na velký jazykový model odchylují od očekávaného chování. Tato odchylka označuje potřebu přetrénování nebo úpravy. Nastavte vlastní výstrahy pro detekci prahových hodnot výkonu. Tento přístup umožňuje včasný zásah v případě, že dojde k problémům. Používejte hodnocení ve službě Azure AI Foundry a metriky podporované službou Machine Learning.
Zajistěte kvalitní zpracování dat. Pro strojové učení musí být trénovací data naformátovaná, čistá a připravená na spotřebu modelů. V případě generování AI musí být základní data ve správném formátu a pravděpodobně blokovaná, rozšířená a vložená pro spotřebu modelu AI. Další informace najdete v tématu Průvodce návrhem a vývojem řešení RAG.
Správa provozní kontinuity
Implementujte nasazení ve více oblastech, abyste zajistili vysokou dostupnost a odolnost pro systémy generování i negenerativní AI. Další informace najdete v tématu Nasazení ve více oblastech v azure AI Foundry, azure Machine Learninga Azure OpenAI.