Zjišťování a redakce osobních identifikačních údajů (PII) v konverzacích
Funkce konverzačnní PII dokáže vyhodnocovat konverzace a vybírat z jejich obsahu citlivé informace (PII) v několika předem definovaných kategoriích a redigovat je. Toto rozhraní API funguje na přepisovaném textu (odkazovaném jako přepisy) i chatech. V případě přepisů rozhraní API také umožňuje redakci zvukových segmentů, které obsahují informace o PII poskytnutím informací o časování zvuku pro tyto zvukové segmenty.
Určení způsobu zpracování dat (volitelné)
Určení modelu detekce PII
Ve výchozím nastavení tato funkce používá ve vstupu nejnovější dostupný model AI. Můžete také nakonfigurovat požadavky rozhraní API tak, aby používaly konkrétní verzi modelu.
Podpora jazyků
Další podrobnosti najdete na stránce podpory jazyka PII. Aktuálně konverzační model PII GA podporuje pouze anglický jazyk. Model Preview a rozhraní API podporují stejné jazyky seznamů jako ostatní jazykové služby.
Podpora oblastí
Konverzační rozhraní API PII podporuje všechny oblasti Azure podporované službou Language.
Odesílání dat
Poznámka:
Informace o formátování konverzačního textu pro odeslání pomocí sady Language Studio najdete v článku o sadě Language Studio .
Vstup můžete odeslat do rozhraní API jako seznam položek konverzace. Analýza se provede po přijetí žádosti. Vzhledem k tomu, že rozhraní API je asynchronní, může dojít ke zpoždění mezi odesláním požadavku rozhraní API a příjmem výsledků. Informace o velikosti a počtu požadavků, které můžete odeslat za minutu a sekundu, najdete v následujících omezeních dat.
Při použití asynchronní funkce jsou výsledky rozhraní API k dispozici po dobu 24 hodin od doby, kdy se žádost ingestovala, a je uvedena v odpovědi. Po uplynutí tohoto časového období se výsledky vyprázdní a už nejsou k dispozici pro načtení.
Když odesíláte data do konverzačních PII, můžete na žádost odeslat jednu konverzaci (chat nebo mluvený hovor).
Rozhraní API se pokusí zjistit všechny definované kategorie entit pro daný vstup konverzace. Pokud chcete určit, které entity se detekují a vrátí, použijte volitelný piiCategories
parametr s příslušnými kategoriemi entit.
U mluvených přepisů se zjištěné entity vrátí na zadanou hodnotu parametru redactionSource
. V současné době jsou podporované hodnoty redactionSource
, , lexical
itn
a maskedItn
(které se mapují na speech na textové rozhraní REST API display
\displayText
, lexical
itn
a maskedItn
formát v uvedeném pořadí).text
Kromě toho pro mluvený vstup přepisu toto rozhraní API také poskytuje informace o časování zvuku, které umožňují redakci zvuku. Pro použití funkce audioRedaction použijte volitelný includeAudioRedaction
příznak s true
hodnotou. Redakce zvuku se provádí na základě lexikálního vstupního formátu.
Poznámka:
PiI konverzace teď podporuje jako velikost dokumentu 40 000 znaků.
Získání výsledků PII
Když z detekce PII získáte výsledky, můžete výsledky streamovat do aplikace nebo uložit výstup do souboru v místním systému. Odpověď rozhraní API zahrnuje rozpoznané entity, včetně jejich kategorií a podkategorií a skóre spolehlivosti. Vrátí se také textový řetězec s entitami PII redacted.
Příklady
Na webu Azure Portal přejděte na stránku přehledu prostředků.
V nabídce na levé straně vyberte Klíče a koncový bod. K ověření požadavků rozhraní API budete potřebovat jeden z klíčů a koncový bod.
Stáhněte a nainstalujte balíček klientské knihovny pro jazyk podle vašeho výběru:
Jazyk Verze balíčku .NET 1.0.0 Python 1.0.0 Další informace o klientovi a návratovém objektu najdete v následující referenční dokumentaci:
Limity služeb a dat
Informace o velikosti a počtu požadavků, které můžete odeslat za minutu a sekundu, najdete v článku o omezeních služeb.