Identifiering av grundlighet

Artikel
10/17/2024

API:et för grundidentifiering identifierar om textsvaren från stora språkmodeller (LLM) är baserade på källmaterialet som tillhandahålls av användarna. Ogrundadhet avser instanser där llm:erna producerar information som inte är faktisk eller felaktig från det som fanns i källmaterialet.

Nyckeltermer

RAG (Retrieval Augmented Generation): RAG är en teknik för att utöka LLM-kunskapen med andra data. LLM:er kan resonera kring omfattande ämnen, men deras kunskap är begränsad till de offentliga data som var tillgängliga när de tränades. Om du vill skapa AI-program som kan resonera kring privata data eller data som introduceras efter en modells slutdatum måste du ange den specifika informationen för modellen. Processen för att föra in lämplig information och infoga den i modellprompten kallas FÖRHÖJD generering (RAG). Mer information finns i Hämtningsförhöjd generering (RAG).
Grund och ogrundadhet i LLM:er: Detta refererar till i vilken utsträckning modellens utdata baseras på angiven information eller återspeglar tillförlitliga källor korrekt. Ett grundat svar följer noga den givna informationen och undviker spekulation eller fabricering. I jordningsmätningar är källinformation avgörande och fungerar som jordningskälla.

Alternativ för grundidentifiering

Följande alternativ är tillgängliga för groundedness-identifiering i Azure AI Content Safety:

Domänval: Användare kan välja en etablerad domän för att säkerställa mer skräddarsydd identifiering som överensstämmer med de specifika behoven i deras fält. De aktuella tillgängliga domänerna är MEDICAL och GENERIC.
Uppgiftsspecifikation: Med den här funktionen kan du välja den uppgift du utför, till exempel QnA (fråga och svar) och Sammanfattning, med justerbara inställningar enligt uppgiftstypen.
Hastighet kontra tolkning: Det finns två lägen som avväger hastighet med resultattolkning.
- Icke-resonemangsläge: Erbjuder snabb identifieringsfunktion; enkelt att bädda in i onlineprogram.
- Resonemangsläge: Ger detaljerade förklaringar för identifierade ogrundade segment; bättre för förståelse och lindring.

Användningsfall

Grundavkänning stöder textbaserad sammanfattning och QnA-uppgifter för att säkerställa att de genererade sammanfattningarna eller svaren är korrekta och tillförlitliga. Här följer några exempel på varje användningsfall:

Sammanfattningsuppgifter:

Medicinsk sammanfattning: I samband med medicinska nyhetsartiklar kan groundedness-identifiering användas för att säkerställa att sammanfattningen inte innehåller fabricerad eller vilseledande information, vilket garanterar att läsarna får korrekt och tillförlitlig medicinsk information.
Sammanfattning av akademiskt papper: När modellen genererar sammanfattningar av akademiska artiklar eller forskningsartiklar kan funktionen hjälpa till att säkerställa att det sammanfattade innehållet korrekt representerar de viktigaste resultaten och bidragen utan att införa falska påståenden.

QnA-uppgifter:

Chattrobotar för kundsupport: I kundsupport kan funktionen användas för att verifiera svaren från AI-chattrobotar, vilket säkerställer att kunderna får korrekt och tillförlitlig information när de ställer frågor om produkter eller tjänster.
Medicinsk QnA: För medicinsk QnA hjälper funktionen till att verifiera noggrannheten i medicinska svar och råd från AI-system till sjukvårdspersonal och patienter, vilket minskar risken för medicinska fel.
Utbildnings-QnA: I utbildningsinställningar kan funktionen tillämpas på QnA-uppgifter för att bekräfta att svar på akademiska frågor eller testförberedelser är faktamässigt korrekta, vilket stöder inlärningsprocessen.

Korrigering av grundlighet

API:et för grundidentifiering innehåller en korrigeringsfunktion som automatiskt korrigerar eventuell upptäckt ogrundad text i texten baserat på de angivna grundkällorna. När korrigeringsfunktionen är aktiverad innehåller svaret ett corrected Text fält som visar den korrigerade texten i linje med grundkällorna.

Användningsfall

Nedan visas flera vanliga scenarier som illustrerar hur och när du ska använda dessa funktioner för att uppnå bästa möjliga resultat.

Sammanfattning i medicinska sammanhang

Du sammanfattar medicinska dokument och det är viktigt att namnen på patienterna i sammanfattningarna är korrekta och överensstämmer med de tillhandahållna grundkällorna.

Exempel på API-begäran:

{
  "domain": "Medical",
  "task": "Summarization",
  "text": "The patient name is Kevin.",
  "groundingSources": [
    "The patient name is Jane."
  ],
}

Förväntat utfall:

Korrigeringsfunktionen identifierar som Kevin inte är grundad eftersom den står i konflikt med jordningskällan Jane. API:et returnerar den korrigerade texten: "The patient name is Jane."

Fråge- och svarsuppgift (QnA) med kundsupportdata

Du implementerar ett QnA-system för en chattrobot för kundsupport. Det är viktigt att svaren från AI:n överensstämmer med den senaste och korrekta information som finns tillgänglig.

Exempel på API-begäran:

{
  "domain": "Generic",
  "task": "QnA",
  "qna": {
    "query": "What is the current interest rate?"
  },
  "text": "The interest rate is 5%.",
  "groundingSources": [
    "As of July 2024, the interest rate is 4.5%."
  ],
}

Förväntat utfall:

API:et identifierar som 5% inte är grundat eftersom det inte matchar den angivna jordningskällan 4.5%. Svaret innehåller korrigeringstexten: "The interest rate is 4.5%."

Skapa innehåll med historiska data

Du skapar innehåll som omfattar historiska data eller händelser, där noggrannhet är avgörande för att upprätthålla trovärdighet och undvika felaktig information.

Exempel på API-begäran:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "The Battle of Hastings occurred in 1065.",
  "groundingSources": [
    "The Battle of Hastings occurred in 1066."
  ],
}

Förväntat utfall:

API:et identifierar det ogrundade datumet 1065 och korrigerar det till 1066 baserat på jordningskällan. Svaret innehåller den korrigerade texten: "The Battle of Hastings occurred in 1066."

Intern dokumentationssammanfattning

Du sammanfattar interna dokument där produktnamn, versionsnummer eller andra specifika datapunkter måste förbli konsekventa.

Exempel på API-begäran:

{
  "domain": "Generic",
  "task": "Summarization",
  "text": "Our latest product is SuperWidget v2.1.",
  "groundingSources": [
    "Our latest product is SuperWidget v2.2."
  ],
}

Förväntat utfall:

Korrigeringsfunktionen identifieras SuperWidget v2.1 som ogrundad och uppdaterar den till SuperWidget v2.2 i svaret. Svaret returnerar den korrigerade texten: "Our latest product is SuperWidget v2.2."

Bästa praxis

Följ följande metodtips när du konfigurerar RAG-system för att få ut bästa möjliga prestanda av API:et för grundidentifiering:

När du hanterar produktnamn eller versionsnummer använder du jordningskällor direkt från interna viktig information eller officiell produktdokumentation för att säkerställa noggrannhet.
För historiskt innehåll korsreferenserar du dina jordningskällor med betrodda akademiska eller historiska databaser för att säkerställa den högsta noggrannhetsnivån.
I en dynamisk miljö som ekonomi använder du alltid de senaste och tillförlitliga jordningskällorna för att säkerställa att AI-systemet ger korrekt och snabb information.
Se alltid till att dina jordningskällor är korrekta och uppdaterade, särskilt inom känsliga områden som sjukvård. Detta minimerar risken för fel i sammanfattningsprocessen.

Begränsningar

Språktillgänglighet

Api:et groundedness detection har för närvarande stöd för engelskt språkinnehåll. Även om vårt API inte begränsar sändning av icke-engelskt innehåll kan vi inte garantera samma kvalitet och noggrannhet i analysen av annat språkinnehåll. Vi rekommenderar att användarna skickar innehåll främst på engelska för att säkerställa de mest tillförlitliga och korrekta resultaten från API:et.

Begränsningar för textlängd

Se Indatakrav för maximala textlängdsbegränsningar.

Region tillgänglighet

Om du vill använda det här API:et måste du skapa din Azure AI Content Safety-resurs i de regioner som stöds. Se Regiontillgänglighet.

Hastighetsbegränsningar

Se Frågefrekvenser.

Om du behöver ett högre pris kontaktar du oss för att begära det.

Nästa steg

Följ snabbstarten för att komma igång med Azure AI Content Safety för att identifiera grunderna.

Snabbstart för grundidentifiering

Dela via

Identifiering av grundlighet

Nyckeltermer

Alternativ för grundidentifiering

Användningsfall

Korrigering av grundlighet

Användningsfall

Sammanfattning i medicinska sammanhang

Fråge- och svarsuppgift (QnA) med kundsupportdata

Skapa innehåll med historiska data

Intern dokumentationssammanfattning

Bästa praxis

Begränsningar

Språktillgänglighet

Begränsningar för textlängd

Region tillgänglighet

Hastighetsbegränsningar

Nästa steg

Feedback

Ytterligare resurser