Обнаружение и редактирование личных сведений в беседах
Признак личных сведений в беседах может оценивать беседы для извлечения конфиденциальной информации (личных сведений) в содержимом по нескольким предварительно определенным категориям и редактировать их. Этот API работает с транскрибированным текстом (на который ссылается расшифровка) и чатами. Для расшифровок API также обеспечивает повторение аудиосегментов, содержащих личные сведения, предоставляя данные о времени произнесения этих аудиосегментов.
Определение способа обработки данных (необязательно)
Указание модели обнаружения персональных данных
По умолчанию эта функция использует последнюю доступную модель ИИ для входных данных. Вы также можете настроить запросы API для использования определенной версии модели.
Поддержка языков
Дополнительные сведения см. на странице поддержки языка PII. В настоящее время модель общедоступной общения piI поддерживает только английский язык. Модель предварительной версии и API поддерживают те же языки списков , что и другие языковые службы.
Поддержка регионов
API общения PII поддерживает все регионы Azure, поддерживаемые языковой службой.
Отправка данных
Примечание.
Входные данные можно отправить в API в виде списка элементов беседы. Анализ выполняется при получении запроса. Так как этот API является асинхронным, может возникать задержка между отправкой запросов к API и получением результатов. Сведения о размере и числе запросов, которые можно отправлять в минуту и секунду, см. в разделе об ограничениях данных ниже.
При использовании асинхронного признака результаты API доступны в течение 24 часов с момента приема запроса и указываются в ответе. По истечении этого периода результаты очищаются и больше не будут доступны для извлечения.
При отправке данных в личные сведения беседы можно отправлять по одной беседе (в форме чате или в устной форме) в каждом запросе.
API пытается обнаружить все определенные категории сущностей для заданных входных данных беседы. Если вы хотите указать, какие сущности обнаружены и возвращаются, используйте необязательный piiCategories
параметр с соответствующими категориями сущностей.
Для речевых расшифровок обнаруженные сущности возвращаются по указанному redactionSource
значению параметра. В настоящее время поддерживаемые значенияredactionSource
: text
, itn
lexical
и maskedItn
(которые сопоставляются с речью с текстом REST API\display
displayText
и lexical
itn
maskedItn
формат соответственно). Кроме того, для голосовых входных данных транскрибирования этот API также предоставляет сведения о времени звука для предоставления возможности редактирования звука. Для использования функции audioRedaction используйте необязательный includeAudioRedaction
флаг со значением true
. Изменение звука выполняется на основе лексического формата ввода.
Примечание.
PiI беседы теперь поддерживает 40 000 символов в виде размера документа.
Получение обнаруженных персональных данных
При получении результатов от функции распознавания персональных данных можно передать результаты в приложение в потоке или сохранить выходные данные в файл в локальной системе. Ответ API включает распознанные сущности, включая их категории и подкатегории, а также оценки достоверности. Строка текста с сущностями PII, редактированная, также возвращается.
Примеры
Перейдите на страницу обзора ресурса на портале Azure
В меню слева выберите Ключи и конечная точка. Для проверки подлинности запросов API вам потребуется один из ключей и конечной точки.
Скачайте и установите пакет клиентской библиотеки для выбранного языка:
Язык Версия пакета .NET 1.0.0 Python 1.0.0 Дополнительные сведения о клиенте и возвращаемом объекте см. в следующей справочной документации:
Ограничения службы и данных
Сведения о размере и числе запросов, которые можно отправлять в минуту и секунду, см. в статье об ограничениях службы.