Como detetar e redigir Informações de Identificação Pessoal (PII) em conversas
O recurso PII conversacional pode avaliar conversas para extrair informações confidenciais (PII) no conteúdo em várias categorias predefinidas e editá-las. Esta API opera tanto em texto transcrito (referenciado como transcrições) como chats. Para transcrições, a API também permite a edição de segmentos de áudio, que contém as informações de PII, fornecendo as informações de temporização de áudio para esses segmentos de áudio.
Determinar como processar os dados (opcional)
Especificar o modelo de deteção de PII
Por padrão, esse recurso usa o modelo de IA mais recente disponível em sua entrada. Você também pode configurar suas solicitações de API para usar uma versão de modelo específica.
Suporte de idiomas
Consulte a página PII Language Support para obter mais detalhes. Atualmente, o modelo PII GA conversacional suporta apenas a língua inglesa. O modelo de visualização e a API suportam os mesmos idiomas de lista que os outros serviços de idiomas.
Suporte de região
A API PII conversacional dá suporte a todas as regiões do Azure suportadas pelo serviço de idiomas.
Envio de dados
Nota
Consulte o artigo do Language Studio para obter informações sobre como formatar texto de conversação para enviar usando o Language Studio.
Você pode enviar a entrada para a API como lista de itens de conversa. A análise é realizada aquando da receção do pedido. Como a API é assíncrona, pode haver um atraso entre o envio de uma solicitação de API e o recebimento dos resultados. Para obter informações sobre o tamanho e o número de solicitações que você pode enviar por minuto e segundo, consulte os limites de dados abaixo.
Ao usar o recurso assíncrono, os resultados da API ficam disponíveis por 24 horas a partir do momento em que a solicitação foi ingerida e são indicados na resposta. Após esse período de tempo, os resultados são limpos e não estão mais disponíveis para recuperação.
Ao enviar dados para PII conversacional, você pode enviar uma conversa (chat ou falada) por solicitação.
A API tenta detetar todas as categorias de entidade definidas para uma determinada entrada de conversa. Se desejar especificar quais entidades serão detetadas e retornadas, use o parâmetro opcional piiCategories
com as categorias de entidades apropriadas.
Para transcrições faladas, as entidades detetadas são retornadas no valor do redactionSource
parâmetro fornecido. Atualmente, os valores suportados para são , , , e maskedItn
(que mapeia para Fala para texto APIs REST , display
\displayText
, e maskedItn
formato, itn
lexical
respectivamente). itn
lexical
text
redactionSource
Além disso, para a entrada de transcrição falada, essa API também fornece informações de temporização de áudio para habilitar a redação de áudio. Para usar o recurso audioRedaction, use o sinalizador opcional includeAudioRedaction
com true
valor. A redação de áudio é realizada com base no formato de entrada lexical.
Nota
A PII de conversação agora suporta 40.000 caracteres como tamanho do documento.
Obtendo resultados de PII
Quando você obtém resultados da deteção de PII, pode transmitir os resultados para um aplicativo ou salvar a saída em um arquivo no sistema local. A resposta da API inclui entidades reconhecidas, incluindo suas categorias e subcategorias, e pontuações de confiança. A cadeia de caracteres de texto com as entidades PII editadas também é retornada.
Exemplos
Vá para a página de visão geral dos recursos no portal do Azure
No menu do lado esquerdo, selecione Teclas e Ponto de extremidade. Você precisará de uma das chaves e do ponto de extremidade para autenticar suas solicitações de API.
Transfira e instale o pacote de biblioteca de cliente para o idioma da sua escolha:
Idioma Versão de pacote .NET 1.0.0 Python 1.0.0 Consulte a documentação de referência a seguir para obter mais informações sobre o cliente e o objeto de retorno:
Limites de serviço e dados
Para obter informações sobre o tamanho e o número de solicitações que você pode enviar por minuto e segundo, consulte o artigo Limites de serviço.