Como detectar e redigir PIIs (informações de identificação pessoal) em conversas
O recurso PII conversacional pode avaliar conversas para extrair informações confidenciais (PII) no conteúdo em várias categorias predefinidas e redigi-las. Essa API opera em texto transcrito (referenciado como transcrições) e chats. Para transcrições, a API também permite a redação de segmentos de áudio, que contém as informações de PII fornecendo as informações de tempo de áudio para esses segmentos de áudio.
Determinar como processar os dados (opcional)
Especificar o modelo de detecção de PII
Por padrão, esse recurso usa o modelo de IA disponível mais recente em sua entrada. Você também pode configurar suas solicitações de API para usar uma versão de modelo específica.
Suporte ao idioma
Consulte a página Suporte à Linguagem PII para obter mais detalhes. Atualmente, o modelo GA de PII de conversação dá suporte apenas ao idioma inglês. O modelo de visualização e a API dão suporte aos mesmos idiomas de lista que os outros serviços de idioma.
Suporte a regiões
A API de PII de conversação dá suporte a todas as regiões do Azure compatíveis com o serviço de idioma.
Enviar dados
Observação
Consulte o artigo do Language Studio para obter mais informações sobre a formatação de texto de conversa para enviar usando o Language Studio.
Você pode enviar a entrada para a API como lista de itens de conversa. A análise é executada após o recebimento da solicitação. Como a API é assíncrona, pode haver um atraso entre o envio de uma solicitação de API e o recebimento dos resultados. Para obter informações sobre o tamanho e o número de solicitações que você pode enviar por minuto e segundo, confira o artigo de limites de dados abaixo.
Ao usar esse recurso assíncrono, os resultados da API ficam disponíveis por 24 horas a partir do momento em que a solicitação foi ingerida e é indicada na resposta. Após esse período de tempo, os resultados são limpos e não estão mais disponíveis para recuperação.
Quando você envia dados para o PII de conversa, você pode enviar uma conversa (por chat ou falada) por solicitação.
A API tenta detectar todas as categorias de entidade definidas para uma determinada entrada de conversa. Se você quiser especificar quais entidades são detectadas e retornadas, use o parâmetro piiCategories
opcional com as categorias de entidade apropriadas.
Para transcrições faladas, as entidades detectadas são retornadas no valor do parâmetro redactionSource
fornecido. Atualmente, os valores com suporte para redactionSource
sãotext
, lexical
, itn
e maskedItn
(que mapeia para API REST de Conversão de fala em Texto no formato display
\displayText
, lexical
, itn
e maskedItn
, respectivamente). Além disso, para a entrada de transcrição falada, essa API também fornece informações de tempo de áudio para capacitar a redação de áudio. Para usar o recurso audioRedaction, use o sinalizador opcional includeAudioRedaction
com valor true
. A redação de áudio é executada com base no formato de entrada lexical.
Observação
A PII de conversa agora dá suporte a 40.000 caracteres como tamanho do documento.
Obtendo resultados de PII
Quando você recebe os resultados da detecção de PII, pode transmiti-los a um aplicativo ou salvar a saída em um arquivo no sistema local. A resposta à API inclui entidades reconhecidas, incluindo suas categorias e subcategorias e pontuações de confiança. A cadeia de texto com as entidades de PII redigidas também é retornada.
Exemplos
No portal do Azure, vá para a página de visão geral do recurso
No menu do lado esquerdo, selecione Chaves e Ponto de Extremidade. Você precisará de uma das chaves e do ponto de extremidade para autenticar as solicitações de API.
Baixe e instale o pacote de biblioteca de clientes para sua linguagem de escolha:
Idioma Versão do pacote .NET 1.0.0 Python 1.0.0 Confira a documentação de referência a seguir para obter mais informações sobre o cliente e retornar o objeto:
Limites de dados e serviços
Para obter informações sobre o tamanho e o número de solicitações que você pode enviar por minuto e segundo, confira o artigo Limites de serviços.