Detekce uzemnění

Článek
10/16/2024

Rozhraní API pro detekci základnosti zjišťuje, jestli jsou textové odpovědi velkých jazykových modelů (LLM) uzemněny ve zdrojových materiálech poskytovaných uživateli. Neuzemněnost odkazuje na případy, kdy LLM vytváří informace, které nejsou faktické nebo nepřesné z toho, co bylo přítomno ve zdrojových materiálech.

Klíčové pojmy

Načítání rozšířené generace (RAG): RAG je technika pro rozšiřování znalostí LLM o další data. LLM mohou mít důvod k širokému rozsahu témat, ale jejich znalosti jsou omezené na veřejná data, která byla k dispozici v době jejich trénování. Pokud chcete vytvářet aplikace AI, které můžou mít důvod k soukromým datům nebo datům zavedeným po datu odříznutí modelu, musíte model poskytnout s danými informacemi. Proces přenesení příslušných informací a jeho vložení do výzvy modelu se označuje jako načtení rozšířené generace (RAG). Další informace naleznete v tématu Načítání rozšířené generace (RAG).
Uzemnění a neuzemnění v LLM: To se týká rozsahu, v jakém jsou výstupy modelu založeny na poskytnutých informacích nebo přesně odrážejí spolehlivé zdroje. Zemněná odpověď se úzce řídí danými informacemi, zabraňuje spekulacím nebo výrobám. Při měření uzemnění jsou informace o zdroji zásadní a slouží jako zdroj uzemnění.

Možnosti detekce uzemnění

Pro detekci groundedness v Azure AI Content Safety jsou k dispozici následující možnosti:

Výběr domény: Uživatelé můžou zvolit vytvořenou doménu, aby zajistili lépe přizpůsobenou detekci, která odpovídá konkrétním potřebám jejich pole. Aktuální dostupné domény jsou MEDICAL a GENERIC.
Specifikace úkolu: Tato funkce umožňuje vybrat úkol, který děláte, například QnA (otázky a odpovědi) a Souhrn s upravitelným nastavením podle typu úkolu.
Rychlost vs interpretovatelnost: Existují dva režimy, které si vyměňují rychlost s interpretovatelností výsledků.
- Režim bez odůvodnění: Nabízí možnost rychlé detekce; snadné vkládání do online aplikací.
- Režim odůvodnění: Nabízí podrobné vysvětlení zjištěných neuzemněných segmentů; lepší porozumění a zmírnění rizik.

Případy použití

Detekce uzemnění podporuje textové shrnutí a úlohy QnA, aby se zajistilo, že vygenerované souhrny nebo odpovědi budou přesné a spolehlivé. Tady je několik příkladů jednotlivých případů použití:

Souhrnné úkoly:

Lékařské shrnutí: V kontextu lékařských novinových článků lze použít detekci uzemnění k zajištění toho, aby souhrn neobsahoval fabricované nebo zavádějící informace, a zaručit tak, že čtenáři získají přesné a spolehlivé lékařské informace.
Shrnutí akademického dokumentu: Když model generuje souhrny akademických dokumentů nebo výzkumných článků, může funkce pomoct zajistit, aby souhrnný obsah přesně představoval klíčové závěry a příspěvky bez zavedení falešných deklarací.

Úlohy QnA:

Chatboti zákaznické podpory: Ve zákaznické podpoře je možné tuto funkci použít k ověření odpovědí poskytovaných chatovacími roboty AI a zajistit, aby zákazníci dostávali přesné a důvěryhodné informace, když se ptají na produkty nebo služby.
Lékařská QnA: U lékařského QnA pomáhá funkce ověřovat přesnost lékařských odpovědí a poradenství poskytovaných systémy umělé inteligence pro zdravotnické pracovníky a pacienty, což snižuje riziko lékařských chyb.
Vzdělávací otázky: Ve vzdělávacím nastavení je možné funkci použít u úkolů QnA, abyste potvrdili, že odpovědi na akademické otázky nebo dotazy na přípravu testů jsou fakticky přesné a podporují proces učení.

Oprava uzemnění

Rozhraní API pro detekci uzemnění zahrnuje funkci opravy, která automaticky opravuje veškerou zjištěnou neuzemnění v textu na základě zadaných zemských zdrojů. Pokud je povolená funkce opravy, odpověď obsahuje corrected Text pole, které zobrazuje opravený text zarovnaný se zdroji zemnění.

Případy použití

Níže si prohlédněte několik běžných scénářů, které ilustrují, jak a kdy tyto funkce použít k dosažení nejlepších výsledků.

Shrnutí v lékařských kontextech

Shrnujete lékařské dokumenty a je důležité, aby jména pacientů v souhrnech byla přesná a konzistentní se zadanými zdroji.

Příklad požadavku rozhraní API:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Očekávaný výsledek:

Funkce opravy zjistí, že Kevin je neuzemněná, protože je v konfliktu se uzemněním zdroje Jane. Rozhraní API vrátí opravený text: "The patient name is Jane."

Úloha otázek a odpovědí (QnA) s daty zákaznické podpory

Implementujete systém QnA pro chatovacího robota zákaznické podpory. Je nezbytné, aby odpovědi poskytované AI odpovídaly nejnovějším a přesným dostupným informacím.

Příklad požadavku rozhraní API:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Očekávaný výsledek:

Rozhraní API zjistí, že 5% je neuzemněné, protože neodpovídá zadanému zdroji uzemnění 4.5%. Odpověď obsahuje text opravy: "The interest rate is 4.5%."

Vytváření obsahu s historickými daty

Vytváříte obsah, který zahrnuje historická data nebo události, kde přesnost je důležitá pro zachování důvěryhodnosti a zabránění mingocho.

Příklad požadavku rozhraní API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Očekávaný výsledek:

Rozhraní API zjistí neuzemněné datum 1065 a opraví ho 1066 na základě podkladového zdroje. Odpověď obsahuje opravený text: "The Battle of Hastings occurred in 1066."

Shrnutí interní dokumentace

Shrnujete interní dokumenty, ve kterých musí zůstat konzistentní názvy produktů, čísla verzí nebo jiné konkrétní datové body.

Příklad požadavku rozhraní API:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Očekávaný výsledek:

Funkce opravy identifikuje SuperWidget v2.1 jako neuzemněné a aktualizuje ji SuperWidget v2.2 v odpovědi. Odpověď vrátí opravený text: "Our latest product is SuperWidget v2.2."

Osvědčené postupy

Při nastavování systémů RAG dodržujte následující osvědčené postupy, abyste získali nejlepší výkon z rozhraní API pro detekci uzemnění:

Při práci s názvy produktů nebo čísly verzí použijte podkladové zdroje přímo z interních poznámek k vydání verze nebo oficiální dokumentace k produktu, abyste zajistili přesnost.
Pro historický obsah křížově odkazujte na podkladové zdroje s důvěryhodnými akademickými nebo historickými databázemi, abyste zajistili nejvyšší úroveň přesnosti.
V dynamickém prostředí, jako je finance, vždy používejte nejnovější a spolehlivé podkladové zdroje, abyste zajistili, že systém AI poskytuje přesné a včasné informace.
Vždy se ujistěte, že základní zdroje jsou přesné a aktuální, zejména v citlivých oblastech, jako je zdravotnictví. Tím se minimalizuje riziko chyb v procesu souhrnu.

Omezení

Dostupnost jazyka

Rozhraní API pro rozpoznávání uzemnění v současné době podporuje obsah anglického jazyka. I když naše rozhraní API neomezuje odesílání neanglických obsahu, nemůžeme zaručit stejnou úroveň kvality a přesnosti při analýze obsahu jiného jazyka. Doporučujeme, aby uživatelé odesílali obsah primárně v angličtině, aby zajistili nejspolehlivější a nejpřesnější výsledky z rozhraní API.

Omezení délky textu

Viz Požadavky na vstup pro omezení maximální délky textu.

Regionální dostupnost

Pokud chcete toto rozhraní API použít, musíte vytvořit prostředek Azure AI Content Safety v podporovaných oblastech. Viz Dostupnost oblastí.

Omezení rychlosti

Podívejte se na sazby dotazů.

Pokud potřebujete vyšší sazbu, kontaktujte nás a požádejte nás o ni.

Další kroky

Postupujte podle rychlého startu a začněte používat Azure AI Content Safety ke zjištění uzemnění.

Rychlý start pro detekci uzemnění

Sdílet prostřednictvím

Detekce uzemnění

Klíčové pojmy

Možnosti detekce uzemnění

Případy použití

Oprava uzemnění

Případy použití

Shrnutí v lékařských kontextech

Úloha otázek a odpovědí (QnA) s daty zákaznické podpory

Vytváření obsahu s historickými daty

Shrnutí interní dokumentace

Osvědčené postupy

Omezení

Dostupnost jazyka

Omezení délky textu

Regionální dostupnost

Omezení rychlosti

Další kroky

Váš názor

Další materiály