Compartilhar via


Detetar e redigir informações de identificação pessoal em conversas

A API PII de conversação da Linguagem de IA do Azure analisa o discurso de áudio para identificar e redigir informações confidenciais (PII) usando várias categorias predefinidas. Esta API funciona tanto em texto transcrito (referido como transcrições) como em chats. Para transcrições, ele também facilita a edição de segmentos de áudio contendo PII, fornecendo as informações de tempo para esses segmentos.

Determinar como processar os dados (opcional)

Especificar o modelo de deteção de PII

Por padrão, esse recurso usa o modelo de IA mais recente disponível em sua entrada. Você também pode configurar suas solicitações de API para usar uma versão de modelo específica.

Suporte de idiomas

Para obter mais informações, consulte a página PII Language Support. Atualmente, o modelo PII GA conversacional suporta apenas a língua inglesa. O modelo de visualização e a API suportam os mesmos idiomas da lista que os outros serviços de idiomas.

Suporte de região

A API PII conversacional dá suporte a todas as regiões do Azure suportadas pelo serviço de idiomas.

Envio de dados

Você pode enviar a entrada para a API como lista de itens de conversa. A análise é realizada aquando da receção do pedido. Como a API é assíncrona, pode haver um atraso entre o envio de uma solicitação de API e o recebimento dos resultados. Para obter informações sobre o tamanho e o número de solicitações que você pode enviar por minuto e segundo, consulte os seguintes limites de dados.

Quando você usa o recurso assíncrono, os resultados da API ficam disponíveis por 24 horas a partir do momento em que a solicitação foi ingerida e são indicados na resposta. Após esse período de tempo, os resultados são limpos e não estão mais disponíveis para recuperação.

Ao enviar dados para PII conversacional, você pode enviar uma conversa (chat ou falada) por solicitação.

A API tenta detetar todas as categorias de entidades definidas para uma entrada de conversa específica. Se desejar especificar quais entidades serão detetadas e retornadas, use o parâmetro opcional piiCategories com as categorias de entidades apropriadas.

Para transcrições faladas, as entidades detetadas são retornadas no valor do parâmetro redactionSource fornecido. Atualmente, os valores suportados para redactionSource são text, lexical, itne maskedItn (que mapeia para o formato de display\displayTextda API REST de fala para texto, lexical, itne maskedItn, respectivamente). Além disso, para a entrada de transcrição falada, essa API também fornece informações de temporização de áudio para habilitar a redação de áudio. Para usar a funcionalidade audioRedaction, use o sinalizador includeAudioRedaction opcional com o valor true. A redação de áudio é realizada com base no formato de entrada lexical.

Observação

A PII de conversação agora suporta 40.000 caracteres como tamanho do documento.

Obtendo resultados de PII

Quando você obtém resultados da deteção de PII, pode transmitir os resultados para um aplicativo ou salvar a saída em um arquivo no sistema local. A resposta da API inclui entidades reconhecidas, incluindo suas categorias e subcategorias, e pontuações de confiança. A cadeia de caracteres de texto com as entidades PII editadas também é retornada.

Exemplos

  1. Vá para a página de visão geral do recurso no portal do Azure

  2. No menu do lado esquerdo, selecione Chaves e Endpoint. Você precisa de uma das chaves e do endpoint para autenticar as suas solicitações de API.

  3. Transfira e instale o pacote de biblioteca de cliente para o idioma da sua escolha:

    Idioma Versão do pacote
    .NET 1.0.0
    Python 1.0.0
  4. Para obter mais informações sobre o cliente e o objeto de retorno, consulte a seguinte documentação de referência:

Limites de serviço e dados

Para obter informações sobre o tamanho e o número de solicitações que você pode enviar por minuto e segundo, consulte o artigo Limites de serviço.