Comece com classificadores treináveis
Um classificador treinável do Microsoft Purview é uma ferramenta que pode preparar para reconhecer vários tipos de conteúdo ao dar-lhe exemplos para analisar. Depois de preparado, pode utilizá-lo para identificar o item para a aplicação de etiquetas de confidencialidade do Office, políticas de conformidade de comunicações e políticas de etiquetas de retenção.
São necessários dois passos para implementar um classificador treinável personalizado:
- Forneça dois conjuntos de dados de exemplo (selecionados por humanos).
- Um conjunto que contém apenas itens que pertencem à categoria.
- Um conjunto que contém apenas itens que não pertencem à categoria.
- Teste a capacidade do classificador de detetar correspondências.
Este artigo explica como criar e testar um classificador personalizado.
Para saber mais sobre os diferentes tipos de classificadores, consulte Saiba mais sobre classificadores treináveis.
Dica
Se você não é um cliente E5, use a avaliação das soluções do Microsoft Purview de 90 dias para explorar como os recursos adicionais do Purview podem ajudar sua organização a gerenciar as necessidades de segurança e conformidade de dados. Comece agora no hub de avaliações do Microsoft Purview. Saiba mais detalhes sobre os termos de inscrição e avaliação.
Pré-requisitos
Requisitos de licenciamento
Os classificadores são uma funcionalidade na Conformidade Microsoft 365 E3 e E5. Tem de ter uma destas subscrições para as utilizar.
Permissões
Para utilizar classificadores nos seguintes cenários, precisa das seguintes permissões:
Cenário | Permissões de Função Necessárias |
---|---|
Política de etiqueta de retenção | Gestão de Registos Gestão de Retenção |
Política de etiquetas de confidencialidade | Administrador de Segurança Administrador de Conformidade Administrador de Dados de Conformidade |
Política de conformidade de comunicações | Administrador de Gestão de Riscos Internos Administrador de Revisão de Supervisão |
Importante
Por predefinição, apenas o utilizador que cria um classificador personalizado pode preparar e rever as predições feitas por esse classificador.
Prepare-se para um classificador treinável personalizado
É útil compreender o que está envolvido na criação de um classificador treinável personalizado antes de começar.
Fluxo de trabalho geral
Para saber mais sobre o fluxo de trabalho geral da criação de classificadores treináveis personalizados, veja o fluxo de processos para criar classificadores treináveis personalizados.
Conteúdo de semeadura
Para garantir que o classificador treinável consegue identificar de forma independente e precisa que um item pertence a uma categoria específica de conteúdo, tem de apresentar várias amostras do tipo de conteúdo que está na categoria. Esta alimentação de amostras para o classificador treinável é conhecida como propagação. Uma pessoa tem de ser a pessoa a selecionar conteúdo de seed e esse conteúdo tem de incluir dois conjuntos de dados: um que contenha apenas itens que representem fortemente o conteúdo que o classificador foi concebido para detetar (amostras positivas) e um segundo conjunto de itens que claramente não pertencem (amostras negativas).
São necessárias, pelo menos, 50 amostras positivas (até 500) e, pelo menos, 150 amostras negativas (até 1500) para preparar um classificador. Quanto mais exemplos fornecer, mais precisas serão as predições que o classificador faz. O classificador treinável processa até aos 2000 exemplos criados mais recentemente (por carimbo de data/hora criado pelo ficheiro).
Dica
Para obter os melhores resultados, tenha, pelo menos, 200 itens no conjunto de exemplos de teste que inclua, pelo menos, 50 exemplos positivos e, pelo menos, 150 exemplos negativos.
Como criar um classificador treinável
Selecione a guia apropriada para o portal que você está usando. Dependendo do seu plano do Microsoft 365, o portal de conformidade do Microsoft Purview será descontinuado ou será descontinuado em breve.
Para saber mais sobre o portal do Microsoft Purview, consulte o portal do Microsoft Purview. Para saber mais sobre o Portal de conformidade, consulte Portal de conformidade do Microsoft Purview.
Em pré-visualização: O processo seguinte automatiza o teste de classificadores treináveis e reduz o fluxo de trabalho de criação de 12 dias para dois dias. (Em alguns casos, o processo pode demorar apenas algumas horas.)
Recolha entre 50 a 500 itens de conteúdo de sementes que representem fortemente os dados que pretende que o classificador identifique positivamente como estando na categoria. Para obter uma lista dos tipos de ficheiro suportados, veja Extensões de nome de ficheiro pesquisadas predefinidas e tipos de ficheiro analisados no SharePoint Server.
Recolha um segundo conjunto de conteúdos de sementes (de 150 a 1500 itens) que representa dados que não pertencem à categoria.
Coloque o conteúdo de seed positivo e negativo em pastas separadas do SharePoint. Cada pasta tem de ser dedicada a conter apenas o conteúdo da semente. Anote o URL do site, da biblioteca e da pasta para cada conjunto.
Dica
Se criar um novo site e pasta do SharePoint para os seus dados de sementes, aguarde pelo menos uma hora para que essa localização seja indexada antes de criar o classificador treinável que irá utilizar esses dados de sementes.
Inicie sessão no portal do Microsoft Purview ou no portal de conformidade do Microsoft Purview com o acesso da função administrador de Conformidade ou Administrador de segurança e navegue paraClassificadores deClassificação> de dados de prevenção> de perda de dados.
Selecione o separador Classificadores treináveis .
Selecione Criar classificador treinável.
Adicione a origem dos seus exemplos positivos : selecione o URL do site, biblioteca e pasta do SharePoint para o conteúdo de seed que deve ser detetado pelo classificador e, em seguida, selecione Seguinte.
Adicione a origem dos seus exemplos negativos : selecione o URL do site, biblioteca e pasta do SharePoint para o conteúdo de seed que deve ser ignorado pelo classificador e, em seguida, selecione Seguinte.
Reveja as definições e selecione Criar classificador treinável.
Dentro de 24 horas ou menos, o classificador treinável processa os dados de seed e cria um modelo de predição. O status do classificador estará Em andamento enquanto processa os dados iniciais. Quando o classificador terminar de processar os dados de seed, o status alterações à Preparação é concluído e os itens foram testados.
Quando a preparação estiver concluída e os itens tiverem sido (automaticamente) testados, publique o classificador ao selecionar Publicar para utilização.
Depois de publicado, o classificador está disponível como uma condição na etiquetagem automática do Office com etiquetas de confidencialidade, política de etiqueta de retenção aplicação automática com base numa condição e em Conformidade de comunicação.
Testar o classificador
Assim que o classificador treinável processar amostras positivas e negativas suficientes para criar um modelo de predição, tem de testar as predições que faz. Ao testar o classificador, verifique se as predições estão corretas. Assim que todos os dados forem processados, veja os resultados manualmente e verifique se cada predição está correta, incorreta ou se não tem a certeza. A Microsoft utiliza este feedback de forma agregada para melhorar o modelo de predição.