Vytvoření řešení RAG pomocí služby Azure AI Search
Tato série kurzů ukazuje vzor pro vytváření řešení RAG ve službě Azure AI Search. Zahrnuje komponenty integrované ve službě Azure AI Search, závislosti a optimalizace pro maximalizaci relevance a minimalizaci nákladů.
Ukázková data jsou kolekce souborů PDF nahraných do Azure Storage. Obsah je z bezplatné elektronické knihy NASA o Zemi.
Vzorový kód najdete v tomto poznámkovém bloku Pythonu, ale doporučujeme použít články v této sérii pro kontext, přehledy a prozkoumání alternativních přístupů.
Cvičení v této řadě
Volba modelů pro vkládání a chat
Návrh indexu pro konverzační vyhledávání
Návrh kanálu indexování, který načítá, bloky dat, vkládání a ingestuje prohledávatelný obsah
Načtení prohledávatelného obsahu pomocí dotazů a modelu chatu
Maximalizace relevance
Minimalizace úložiště a nákladů
Vynechali jsme několik aspektů modelu RAG, abychom snížili složitost:
Žádná správa historie chatu a kontextu. Historie chatu se obvykle ukládá a spravuje odděleně od podkladových dat, což znamená další kroky a kód. V tomto kurzu se předpokládá atomická otázka a odpovědi z LLM a výchozí prostředí LLM.
Žádné zabezpečení jednotlivých uživatelů oproti výsledkům (co označujeme jako "oříznutí zabezpečení"). Pokud potřebujete další informace a zdroje informací, začněte ořezáváním zabezpečení a nezapomeňte si projít odkazy na konci článku.
Tato série se věnuje základům vývoje řešení RAG. Jakmile porozumíte základům, pokračujte akcelerátory a dalšími ukázkami kódu, které poskytují více abstrakce nebo jsou jinak vhodnější pro produkční prostředí a složitější úlohy.
Proč používat Azure AI Search pro RAG?
Chatovací modely čelí omezením objemu dat, která můžou na žádosti přijmout. Službu Azure AI Search byste měli použít, protože kvalita obsahu předaného LLM může vytvořit nebo přerušit řešení RAG.
Azure AI Search poskytuje nejlepší vstupy do chatovacího modelu s integrací AI a komplexním laděním relevance. Vyhledávací modul podporuje vyhledávání vektorové podobnosti (více algoritmů), vyhledávání klíčových slov, přibližné vyhledávání, geoprostorové vyhledávání a filtry. Můžete vytvářet žádosti hybridních dotazů, které obsahují všechny tyto komponenty, a můžete řídit, kolik každý dotaz přispívá k celkovému požadavku.