Compartilhar via


Preparar um modelo de codificação preditiva (pré-visualização)

Dica

A Deteção de Dados Eletrónicos (pré-visualização) está agora disponível no novo portal do Microsoft Purview. Para saber mais sobre como utilizar a nova experiência de Deteção de Dados Eletrónicos, veja Saiba mais sobre a Deteção de Dados Eletrónicos (pré-visualização).

Importante

A codificação preditiva foi descontinuada a partir de 31 de março de 2024 e não está disponível em novos casos de Deteção de Dados Eletrónicos. Para casos existentes com modelos de codificação preditiva preparados, pode continuar a aplicar filtros de classificação existentes para rever conjuntos. No entanto, não pode criar ou preparar novos modelos.

Depois de criar um modelo de codificação preditiva no Descoberta Eletrônica do Microsoft Purview (Premium), o passo seguinte consiste em realizar a primeira ronda de preparação para preparar o modelo sobre o conteúdo relevante e não relevante no conjunto de revisões. Depois de concluir a primeira ronda de preparação, pode realizar rondas de preparação subsequentes para melhorar a capacidade do modelo de prever conteúdos relevantes e não relevantes.

Para rever o fluxo de trabalho de codificação preditiva, veja Saiba mais sobre a codificação preditiva na Deteção de Dados Eletrónicos (Premium)

Dica

Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de testes do portal de conformidade do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.

Antes de preparar um modelo

  • Durante uma ronda de preparação, label items as Relevant or Not relevant based on the relevancy of the content in the document. Não baseie a sua decisão nos valores nos campos de metadados. Por exemplo, para mensagens de e-mail ou conversações do Teams, não baseie a sua decisão de etiquetagem nos participantes da mensagem.

Preparar um modelo pela primeira vez

Observação

Durante um período de tempo limitado, esta experiência de Deteção de Dados Eletrónicos clássica também está disponível no novo portal do Microsoft Purview. Ative a experiência de Deteção de Dados Eletrónicos clássica do Portal de Conformidade nas definições da experiência de Deteção de Dados Eletrónicos (pré-visualização) para apresentar a experiência clássica no novo portal do Microsoft Purview.

  1. Na portal de conformidade do Microsoft Purview, abra um caso de Deteção de Dados Eletrónicos (Premium) e, em seguida, selecione o separador Conjuntos de revisão.

  2. Abra um conjunto de revisões e, em seguida,selecione Gerir codificação preditiva (pré-visualização) da Análise>.

  3. Na página Modelos de codificação preditiva (pré-visualização), selecione o modelo que pretende preparar.

  4. No separador Descrição geral , em 1.ª ronda, selecione Iniciar próxima ronda de preparação.

    O separador Preparação é apresentado e contém 50 itens para etiquetar.

  5. Reveja cada documento e, em seguida, selecione Relevante ou Não relevante na parte inferior do painel de leitura para o etiquetar.

    Etiquetar cada documento como relevante ou não relevante.

  6. Depois de etiquetar todos os 50 itens, selecione Concluir.

    O sistema demorará alguns minutos a "aprender" com a etiquetagem e a atualizar o modelo. Quando este processo estiver concluído, é apresentada uma status de Pronto para o modelo na página Modelos de codificação preditiva (pré-visualização).

Realizar rondas de preparação adicionais

Depois de realizar a primeira ronda de preparação, pode realizar as rondas de preparação subsequentes seguindo os passos na secção anterior. A única diferença é que o número da ronda de preparação será atualizado no separador Descrição Geral do modelo. Por exemplo, depois de realizar a primeira ronda de preparação, pode selecionar Iniciar próxima ronda de preparação para iniciar a segunda ronda de preparação. E assim por diante.

Cada ronda de preparação (tanto as que estão em curso como as que estão concluídas) é apresentada no separador Preparação do modelo. Quando seleciona uma ronda de preparação, é apresentada uma página de lista de opções com informações e métricas para a ronda.

O que acontece depois de realizar uma ronda de preparação

Depois de realizar a primeira ronda de preparação, é iniciada uma tarefa que faz o seguinte:

  • Com base na forma como classificou os 40 itens no conjunto de preparação, o modelo aprende com a sua etiquetagem e atualiza-se para se tornar mais preciso.

  • Em seguida, o modelo processa cada item em todo o conjunto de revisão e atribui uma classificação de predição entre 0 (não relevante) e 1 (relevante).

  • O modelo atribui uma classificação de predição aos 10 itens no conjunto de controlo que classificou durante a ronda de preparação. O modelo compara a classificação de predição destes 10 itens com a etiqueta real que atribuiu ao item durante a ronda de preparação. Com base nesta comparação, o modelo identifica a seguinte classificação (denominada matriz de confusão do conjunto de controlo) para avaliar o desempenho de predição do modelo:



Rótulo O modelo prevê que o item é relevante O modelo prevê que o item não é relevante
Item de etiquetas do revisor como relevante Verdadeiro positivo Falso positivo
Item de etiquetas do revisor como não relevante Falso negativo Verdadeiro negativo

Com base nestas comparações, o modelo obtém valores para as métricas de classificação F, precisão e revocação e a margem de erro para cada uma. As classificações para estas métricas de desempenho do modelo são apresentadas numa página de lista de opções para a ronda de preparação. Para obter uma descrição destas métricas, veja Referência de codificação preditiva.

  • Por fim, o modelo determina os próximos 50 itens que serão utilizados para a próxima ronda de preparação. Desta vez, o modelo pode selecionar 20 itens do conjunto de controlo e 30 novos itens do conjunto de revisão e designá-los como o conjunto de preparação para a próxima ronda. A amostragem para a próxima ronda de preparação não é amostrada uniformemente. O modelo otimizará a seleção de amostragem de itens do conjunto de revisão para selecionar itens onde a predição é ambígua, o que significa que a classificação de predição está no intervalo de 0,5. Este processo é conhecido como seleção tendenciosa.

O que acontece depois de realizar as rondas de preparação subsequentes

Depois de realizar as rondas de preparação subsequentes (após a primeira ronda de preparação), o modelo faz o seguinte:

  • O modelo é atualizado com base nas etiquetas que aplicou ao conjunto de preparação nessa ronda de preparação.
  • O sistema avalia a classificação de predição do modelo nos itens no conjunto de controlo e marcar se a classificação está alinhada com a forma como classificou os itens no conjunto de controlo. A avaliação é efetuada em todos os itens etiquetados do conjunto de controlo para todas as rondas de preparação. Os resultados desta avaliação são incorporados no dashboard no separador Descrição geral do modelo.
  • O modelo atualizado reprocessa cada item no conjunto de revisão e atribui a cada item uma classificação de predição atualizada.

Próximas etapas

Depois de realizar a primeira ronda de preparação, pode realizar mais rondas de preparação ou aplicar o filtro de classificação de predição do modelo ao conjunto de revisões para ver os itens que o modelo previu como relevantes ou não relevantes. Para obter mais informações, veja Aplicar um filtro de classificação de predição a um conjunto de revisões.