Krok 5 (generování). Jak ladit kvalitu generování

Článek
01/23/2025

Tato stránka popisuje, jak identifikovat původní příčinu problémů s generováním. Tuto stránku použijte, pokud analýza původní příčiny indikuje původní příčinu Improve Generation.

I s optimálním načtením, pokud komponenta LLM řetězce RAG nemůže efektivně využít načtený kontext k vygenerování přesných, koherentních a relevantních odpovědí, konečná kvalita výstupu trpí. Mezi způsoby, jak se můžou objevit problémy s kvalitou generování, jsou halucinace, nekonzistence nebo selhání stručné řešení dotazu uživatele.

Pokyny

Při řešení problémů s kvalitou generování postupujte takto:

Otevřete poznámkový blok B_quality_iteration/01_root_cause_quality_issues.
Pomocí dotazů načtěte trasování MLflow záznamů, u které došlo k problémům s kvalitou generování.
U každého záznamu ručně prozkoumejte vygenerovanou odpověď a porovnejte ji s načteným kontextem a odpovědí na základní pravdu.
Hledejte vzory nebo běžné problémy mezi dotazy s nízkou kvalitou generování. Příklad:
- Generování informací, které nejsou přítomné v načteného kontextu.
- Generování informací, které nejsou konzistentní s načteným kontextem (halucinace).
- Nepodařilo se přímo adresovat dotaz uživatele vzhledem k zadanému načteného kontextu.
- Generování odpovědí, které jsou příliš podrobné, obtížně pochopitelné nebo chybí logická soudržnost.
Na základě zjištěného problému hypotézy potenciální původní příčiny a odpovídající opravy. Pokyny najdete v běžných důvodech nízké kvality generování.
Při implementaci a vyhodnocení změn proveďte a vyhodnoťte potenciální opravu. To může zahrnovat úpravu řetězce RAG (například úpravu šablony výzvy nebo vyzkoušení jiného LLM) nebo datového kanálu (například úprava strategie bloků dat tak, aby poskytovala více kontextu).
Pokud kvalita generování stále není uspokojivá, opakujte kroky 4 a 5 pro další nejslibnější opravu, dokud nedosáhne požadovaného výkonu.
Znovu spusťte analýzu původní příčiny, abyste zjistili, jestli má celkový řetězec další původní příčiny, které by se měly řešit.

Běžné důvody nízké kvality generování

Následující tabulka uvádí kroky odstraňování chyb a potenciální opravy běžných problémů při generování. Opravy jsou kategorizovány podle komponent:

Konfigurace řetězu
Řetězení kódu

Komponenta definuje kroky, které byste měli provést v kroku implementace a vyhodnocení změn .

Důležité

Databricks doporučuje, abyste použili výzvu k iteraci na kvalitě výstupů vaší aplikace. Většina následujících kroků používá výzvu k technickému zpracování.

Problém s generováním	Postup ladění	Potenciální oprava
Vygenerované informace se nenachází v načtených kontextech (například halucinace).	- Porovnejte generované odpovědi na načtený kontext k identifikaci hallukovaných informací. – Vyhodnoťte, jestli jsou určité typy dotazů nebo načteného kontextu náchylnější k halucinacím.	- konfigurace řetězu šablony výzvy k aktualizaci, která zvýrazní závislost na načtený kontext. - Zřetězte konfiguraci pomocí llm s větší podporou. - Zřetězení kódu Implementuje krok kontroly faktů nebo ověření po generování.
Nepodařilo se přímo adresovat dotaz uživatele nebo poskytovat příliš obecné odpovědi	- Porovnání vygenerovaných odpovědí na dotazy uživatelů za účelem posouzení relevance a specifikity. – Zkontrolujte, jestli některé typy dotazů mají za následek načtení správného kontextu, ale LLM vytváří výstup nízké kvality.	- Zřetězení konfigurace Vylepšit šablonu výzvy, aby podporovala přímé, specifické odpovědi. - Zřetězte konfiguraci Načtení cílenějšího kontextu vylepšením procesu načítání. - Zřetězte výsledky načítání kódu re-rank tak, aby se jako první vložily nejrelevavantnější bloky dat, pouze je poskytněte LLM. - Zřetězte konfiguraci pomocí llm s větší podporou.
Vygenerované odpovědi jsou obtížně pochopitelné nebo chybí logický tok.	- Vyhodnocení výstupu logického toku, gramatické správnosti a srozumitelnosti – Analyzujte, jestli dochází k neslušnosti častěji s určitými typy dotazů nebo při načtení určitých typů kontextu.	- Zřetězení šablony výzvy ke změně konfigurace , která podporuje koherentní a dobře strukturovanou odpověď. - Zřetězený config Poskytnout další kontext LLM načtením dalších relevantních bloků dat. - Zřetězte konfiguraci pomocí llm s větší podporou.
Vygenerované odpovědi nejsou v požadovaném formátu nebo stylu.	- Porovnejte výstup s očekávaným formátem a pokyny pro styl. – Vyhodnoťte, jestli jsou určité typy dotazů nebo načtených kontextů pravděpodobnější, že budou mít za následek odchylky formátu nebo stylu.	- Konfigurace řetězu Aktualizujte šablonu výzvy pro specifikaci požadovaného formátu a stylu výstupu. - Zřetězený kód Implementujte krok následného zpracování, který převede vygenerovanou odpověď do požadovaného formátu. - Zřetězený kód Přidejte krok pro ověření struktury a stylu výstupu a v případě potřeby vypište záložní odpověď. - Zřetězený config Použijte LLM, který je vyladěný k poskytování výstupů v určitém formátu nebo stylu.

Další krok

Pokud jste také zjistili problémy s kvalitou načítání, pokračujte krokem 5 (načtení). Jak ladit kvalitu načítání

Pokud se domníváte, že jste vyřešili všechny zjištěné problémy, pokračujte krokem 6. Proveďte a vyhodnoťte opravy kvality u agenta AI.

< Předchozí: Krok 5.1. Ladění kvality načítání

Další: Krok 6. Iterativní řešení problémů s kvalitou >

Sdílet prostřednictvím

Krok 5 (generování). Jak ladit kvalitu generování

Pokyny

Běžné důvody nízké kvality generování

Další krok

Váš názor

Další materiály