Jak wykrywać i redagować dane osobowe w konwersacjach
Funkcja Conversational PII może oceniać konwersacje w celu wyodrębnienia poufnych informacji (PII) w treści w kilku wstępnie zdefiniowanych kategoriach i ich redagowania. Ten interfejs API działa zarówno na transkrypcji tekstu (przywoływał się jako transkrypcje) i czatach. W przypadku transkrypcji interfejs API umożliwia również redaction segmentów audio, które zawierają informacje o danych osobowych, dostarczając informacje o chronometrażu audio dla tych segmentów audio.
Określanie sposobu przetwarzania danych (opcjonalnie)
Określanie modelu wykrywania danych biznesowych
Domyślnie ta funkcja używa najnowszego dostępnego modelu sztucznej inteligencji w danych wejściowych. Możesz również skonfigurować żądania interfejsu API tak, aby używały określonej wersji modelu.
Obsługa języków
Aby uzyskać więcej informacji, zobacz stronę pomocy technicznej języka pii. Obecnie konwersacyjny model ogólnie dostępny dla danych biznesowych obsługuje tylko język angielski. Model w wersji zapoznawczej i interfejs API obsługują te same języki listy co inne usługi językowe.
Obsługa regionów
Interfejs API konwersacyjnych danych pii obsługuje wszystkie regiony świadczenia usługi Azure obsługiwane przez usługę językową.
Przesyłanie danych
Uwaga
Zobacz artykuł Language Studio, aby uzyskać informacje na temat formatowania tekstu konwersacyjnego do przesłania przy użyciu programu Language Studio.
Dane wejściowe można przesłać do interfejsu API jako listę elementów konwersacji. Analiza jest wykonywana po odebraniu żądania. Ponieważ interfejs API jest asynchroniczny, może wystąpić opóźnienie między wysłaniem żądania interfejsu API i odebraniem wyników. Aby uzyskać informacje na temat rozmiaru i liczby żądań, które można wysłać na minutę i sekundę, zobacz poniższe limity danych.
W przypadku korzystania z funkcji asynchronicznych wyniki interfejsu API są dostępne przez 24 godziny od momentu pozyskiwania żądania i są wskazywane w odpowiedzi. Po upływie tego okresu wyniki są czyszczone i nie są już dostępne do pobierania.
Podczas przesyłania danych do konwersacyjnych danych piI można wysłać jedną konwersację (czat lub rozmowę) na żądanie.
Interfejs API próbuje wykryć wszystkie zdefiniowane kategorie jednostek dla danych wejściowych konwersacji. Jeśli chcesz określić, które jednostki są wykrywane i zwracane, użyj opcjonalnego piiCategories
parametru z odpowiednimi kategoriami jednostek.
W przypadku transkrypcji mówionych wykryte jednostki są zwracane na podanej wartości parametru redactionSource
. Obecnie obsługiwane wartości redactionSource
to , , lexical
itn
i maskedItn
(które są mapowane na mowę na tekst interfejsu API display
\displayText
REST , lexical
itn
i formaty maskedItn
odpowiednio).text
Ponadto w przypadku danych wejściowych transkrypcji mówionych ten interfejs API udostępnia również informacje o chronometrażu dźwięku w celu umożliwienia redaction audio. Aby użyć funkcji audioRedaction, użyj opcjonalnej includeAudioRedaction
flagi z wartością true
. Redaction audio jest wykonywana na podstawie formatu danych wejściowych leksykalnych.
Uwaga
Identyfikator PII konwersacji obsługuje teraz 40 000 znaków jako rozmiar dokumentu.
Uzyskiwanie wyników danych pii
Po otrzymaniu wyników z wykrywania danych pii można przesyłać strumieniowo wyniki do aplikacji lub zapisywać dane wyjściowe w pliku w systemie lokalnym. Odpowiedź interfejsu API zawiera rozpoznane jednostki, w tym ich kategorie i podkategorie oraz oceny ufności. Zwracany jest również ciąg tekstowy z jednostkami piI, które zostały zredagowane.
Przykłady
Przejdź do strony przeglądu zasobu w witrynie Azure Portal
Z menu po lewej stronie wybierz pozycję Klucze i punkt końcowy. Do uwierzytelniania żądań interfejsu API potrzebny będzie jeden z kluczy i punkt końcowy.
Pobierz i zainstaluj pakiet biblioteki klienta dla wybranego języka:
Język Wersja pakietu .NET 1.0.0 Python 1.0.0 Zobacz następującą dokumentację referencyjną, aby uzyskać więcej informacji na temat klienta i zwracać obiekt:
Limity usług i danych
Aby uzyskać informacje na temat rozmiaru i liczby żądań, które można wysłać na minutę i sekundę, zobacz artykuł Dotyczący limitów usług.