Sdílet prostřednictvím


Krok 7. Nasazení a monitorování

Tento článek obsahuje základní pokyny k nasazení a monitorování testování konceptu aplikace AI gen.

Nasazení a monitorování

Teď, když jste vytvořilisvou gen AI aplikaci, ji vyhodnotilia zlepšili její kvalitu, je čas nasadit gen AI aplikaci do produkčního prostředí. Je důležité si uvědomit, že to neznamená, že provádíte monitorování výkonu a shromažďování zpětné vazby. Iterace kvality zůstává velmi důležitá i po nasazení, protože se v průběhu času můžou měnit vzory dat i využití.

Se službou Databricks je váš řetězec připraven k okamžitému nasazení v aktuálním stavu pomocí služby Mosaic AI Agent Serving. Pokyny najdete v tématu Nasazení agenta pro generování aplikace AI.

Nasazení

Správné nasazení je zásadní pro zajištění hladkého provozu a úspěchu vašeho řešení RAG. Při nasazování aplikace RAG je potřeba vzít v úvahu následující důležité aspekty:

  1. Identifikace klíčových integračních bodů
    • Analyzujte stávající systémy a pracovní postupy a určete, kde a jak se má řešení RAG integrovat.
    • Vyhodnoťte, jestli jsou určité integrace důležitější nebo složitější než jiné, a odpovídajícím způsobem určete prioritu.
  2. Implementace správy verzí a škálovatelnosti
    • Nastavte pro své modely systém správy verzí, který umožňuje snadné sledování a vrácení zpět.
    • Navrhněte architekturu nasazení pro efektivní zpracování rostoucí zátěže a škálování s využitím nástrojů, jako je obsluha modelu Databricks.
  3. Zajištění zabezpečení a řízení přístupu
    • Při nasazování řešení RAG dodržujte osvědčené postupy zabezpečení, jako je zabezpečení koncových bodů a ochrana citlivých dat.
    • Implementujte správné mechanismy řízení přístupu, abyste zajistili, že s řešením RAG můžou pracovat jenom autorizovaní uživatelé.

Sledování

Jakmile nasadíte aplikaci RAG, je nezbytné monitorovat její výkon. Skutečné využití může odhalit problémy, které se během dřívějšího testování a vyhodnocení nemusí projevit. Změny dat a požadavků navíc můžou mít vliv na výkon aplikace v průběhu času. Následují důležité postupy monitorování, které je potřeba dodržovat:

  1. Vytvoření metrik monitorování a protokolování
    • Definujte klíčové metriky výkonu pro monitorování stavu a efektivity vašeho řešení RAG, jako je přesnost, doba odezvy a využití prostředků.
    • Implementujte komplexní protokolování pro zachycení důležitých událostí, chyb a interakcí uživatelů pro účely ladění a zlepšování.
  2. Nastavení upozornění a kanálů zpětné vazby
    • Nakonfigurujte upozornění, která vás upozorní na anomálie nebo kritické problémy, což umožňuje proaktivní řešení problémů.
    • Poskytněte uživatelům kanály, které mají poskytnout zpětnou vazbu k řešení RAG, a pravidelně kontrolovat a řešit tuto zpětnou vazbu.
  3. Průběžné monitorování a vylepšování
    • Průběžně analyzujte výkon vašeho řešení RAG pomocí zavedených metrik monitorování.
    • Využijte přehledy získané z monitorování k řízení iterativních vylepšení a optimalizací řešení RAG.
  4. Provádění pravidelných kontrol stavu
    • Naplánujte pravidelné kontroly stavu a proaktivně identifikujte a vyřešte případné problémy, než ovlivní uživatele.
    • Vyhodnoťte, jestli jsou určité komponenty nebo integrace náchylnější k problémům a vyžadují bližší monitorování.

< Předchozí: Krok 6.1. Oprava datového kanálu

Návrat na navigační stránku