Classificações personalizadas no Microsoft Purview
Este artigo descreve como pode criar classificações personalizadas para definir tipos de dados no seu património de dados que são exclusivos da sua organização. Também descreve a criação de regras de classificação personalizadas que lhe permitem encontrar dados especificados em todo o seu património de dados.
Importante
Para criar uma classificação personalizada, precisa da permissão de curador de dados ou administrador de origem de dados num domínio ou coleção. As permissões em qualquer nível de coleção são suficientes. Para obter mais informações sobre permissões, consulte: Permissões de governação de dados do Microsoft Purview.
Classificações de sistema predefinidas
O Mapa de Dados do Microsoft Purview fornece um grande conjunto de classificações de sistema predefinidas que representam tipos de dados pessoais típicos que poderá ter no seu património de dados. Para obter a lista completa de classificações de sistema disponíveis, consulte: Classificações suportadas no Microsoft Purview.
Também pode criar classificações personalizadas se alguma das classificações predefinidas não corresponder às suas necessidades.
Observação
- As nossas regras de amostragem de dados são aplicadas às classificações personalizadas e do sistema.
- As classificações personalizadas só são aplicadas a origens de dados estruturadas, como SQL e CosmosDB, e a tipos de ficheiro estruturados, como CSV, JSON e Parquet. A classificação personalizada não é aplicada a tipos de ficheiros de dados não estruturados, como DOC, PDF e XLSX.
Passos para criar uma classificação personalizada
Para criar uma classificação personalizada, siga estes passos:
Precisará de permissões de curador de dados ou administrador de origens de dados em qualquer coleção para poder criar uma classificação personalizada.
No portal do Microsoft Purview, abra a solução Mapa de dados .
Selecione Gestão de anotações , selecione Classificações.
Selecione + Novo.
O painel Adicionar nova classificação é aberto, onde pode atribuir um nome e uma descrição à sua classificação. É uma boa prática utilizar uma convenção de espaçamento entre nomes, como your company name.classification name
.
As classificações de sistema da Microsoft são agrupadas no espaço de nomes reservado MICROSOFT.
. Um exemplo é a MICROSOFT. GOVERNO. E.U.A. SOCIAL_SECURITY_NUMBER.
O nome da classificação tem de começar com uma letra seguida de uma sequência de letras, números e carateres de ponto final (.) ou carateres de sublinhado. À medida que escreve, a experiência de utilizador gera automaticamente um nome amigável. Este nome amigável é o que os utilizadores veem ao aplicá-lo a um recurso no catálogo.
Para manter o nome curto, o sistema cria o nome amigável com base na seguinte lógica:
Todos menos os dois últimos segmentos do espaço de nomes são cortados.
A caixa é ajustada para que a primeira letra de cada palavra seja em maiúscula.
Todos os carateres de sublinhado (_) são substituídos por espaços.
Por exemplo, se deu o nome contoso.hr.employee_ID de classificação, o nome amigável é armazenado no sistema como ID hr.employee.
Selecione OK e a nova classificação é adicionada à lista Classificação personalizada .
Selecionar a classificação na lista abre a página de detalhes de classificação. Aqui, encontrará todos os detalhes sobre a classificação.
Estes detalhes incluem a contagem de instâncias existentes, o nome formal, as regras de classificação associadas (se aplicável) e o nome do proprietário.
Regras de classificação personalizadas
O mapa de dados fornece um conjunto de regras de classificação predefinidas que são utilizadas pelo analisador para detetar automaticamente determinados tipos de dados. Também pode adicionar as suas próprias regras de classificação personalizadas para detetar outros tipos de dados que poderá estar interessado em encontrar no seu património de dados. Esta capacidade pode ser poderosa quando está a tentar encontrar dados no seu património de dados.
Observação
As regras de classificação personalizadas só são suportadas no idioma inglês.
Por exemplo, digamos que uma empresa com o nome Contoso tem IDs de funcionários padronizados em toda a empresa com a palavra "Funcionário" seguido de um GUID para criar EMPLOYEE{GUID}. Por exemplo, uma instância de um ID de funcionário é semelhante EMPLOYEE9c55c474-9996-420c-a285-0d0fc23f1f55
a .
A Contoso pode configurar o sistema de análise para localizar instâncias destes IDs ao criar uma regra de classificação personalizada. Podem fornecer uma expressão regular que corresponda ao padrão de dados, neste caso, \^Employee\[A-Za-z0-9\]{8}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{4}-\[A-Za-z0-9\]{12}\$
. Opcionalmente, se os dados estiverem normalmente numa coluna da qual sabem o nome, como Employee_ID ou EmployeeID, podem adicionar uma expressão regular de padrão de coluna para tornar a análise ainda mais precisa. Um exemplo de regex é Employee_ID|EmployeeID.
Em seguida, o sistema de análise pode utilizar esta regra para examinar os dados reais na coluna e o nome da coluna para tentar identificar todas as instâncias onde o padrão de ID de funcionário é encontrado.
Passos para criar uma regra de classificação personalizada
Crie uma classificação personalizada que siga as instruções na secção anterior. Irá adicionar esta classificação personalizada na configuração da regra de classificação para que o sistema a aplique quando encontrar uma correspondência na coluna.
No portal do Microsoft Purview, abra a solução Mapa de dados .
Em Gestão de anotações, selecione a secção Regras de classificação .
Selecione Novo.
É aberta a caixa de diálogo Nova regra de classificação . Preencha os campos e decida se pretende criar uma regra de expressão regular ou uma regra de dicionário.
Campo Descrição Nome Obrigatório. O máximo é de 100 carateres. Descrição Opcional. O máximo é de 256 carateres. Nome da Classificação Obrigatório. Selecione o nome da classificação na lista pendente para indicar ao scanner para aplicá-la se for encontrada uma correspondência. Estado Obrigatório. As opções estão ativadas ou desativadas. Ativado é a predefinição.
Criar uma Regra de Expressão Regular
Importante
As expressões regulares em classificações personalizadas não são sensíveis a maiúsculas e minúsculas.
Se criar uma regra de expressão regular, verá o ecrã seguinte. Opcionalmente, pode carregar um ficheiro que será utilizado para gerar padrões regex sugeridos para a sua regra. Só são suportadas regras de idioma em inglês.
Se decidir gerar um padrão regex sugerido, depois de carregar um ficheiro, selecione um dos padrões sugeridos e selecione Adicionar aos Padrões para utilizar os padrões de dados e coluna sugeridos. Pode ajustar os padrões sugeridos ou também pode escrever os seus próprios padrões sem carregar um ficheiro.
Campo Descrição Padrão de Dados Opcional. Uma expressão regular que representa os dados armazenados no campo de dados. O limite é grande. No exemplo anterior, os padrões de dados testam um ID de funcionário que é literalmente a palavra Employee{GUID}
.Padrão de Coluna Opcional. Uma expressão regular que representa os nomes de coluna que pretende que correspondam. O limite é grande. Em Padrão de Dados , pode utilizar o Limiar mínimo de correspondência para definir a percentagem mínima das correspondências de valores de dados distintos numa coluna que tem de ser encontrada pelo analisador para que a classificação seja aplicada. O valor sugerido é 60%. Se especificar múltiplos padrões de dados, esta definição será desativada e o valor será fixo em 60%.
Observação
O limiar mínimo de correspondência tem de ser, pelo menos, 1%.
Agora pode verificar a regra e criá-la .
Teste a regra de classificação antes de concluir o processo de criação para validar que irá aplicar etiquetas aos seus recursos. As classificações na regra serão aplicadas aos dados de exemplo carregados tal como numa análise. Isto significa que todas as classificações do sistema e a classificação personalizada serão correspondidas aos dados no seu ficheiro.
Os ficheiros de entrada podem incluir ficheiros delimitados (conteúdo CSV, PSV, SSV, TSV), JSON ou XML. O conteúdo será analisado com base na extensão de ficheiro do ficheiro de entrada. Os dados delimitados podem ter uma extensão de ficheiro que corresponda a qualquer um dos tipos mencionados. Por exemplo, os dados TSV podem existir num ficheiro com o nome MySampleData.csv. O conteúdo delimitado também tem de ter um mínimo de três colunas.
Criar uma Regra de Dicionário
Se criar uma regra de dicionário, verá o ecrã seguinte. Carregue um ficheiro que contenha todos os valores possíveis para a classificação que está a criar numa única coluna. Só são suportadas regras de idioma em inglês.
Depois de o dicionário ser gerado, pode ajustar o limiar mínimo de correspondência e submeter a regra.
Editar ou eliminar uma classificação personalizada
Para atualizar ou editar uma classificação personalizada, siga estes passos:
No portal do Microsoft Purview, abra a solução Mapa de dados .
Em Gestão de anotações , selecione Classificações.
Selecione o separador Personalizado .
Selecione a classificação que pretende editar e, em seguida, selecione o botão Editar .
Agora, pode editar a descrição desta classificação personalizada. Selecione o botão Ok quando terminar de guardar as alterações.
Para eliminar uma classificação personalizada:
- Depois de abrir o Mapa de dados e, em seguida, Classificações, selecione o separador Personalizado .
- Selecione a classificação que pretende eliminar ou múltiplas classificações que pretende eliminar e, em seguida, selecione o botão Eliminar .
Também pode editar ou eliminar uma classificação dentro da própria classificação. Basta selecionar a sua classificação e, em seguida, selecionar os botões Editar ou Eliminar no menu superior.
Ativar ou desativar regras de classificação
Na sua conta do Microsoft Purview, selecione o Mapa de dados e, em seguida , Regras de classificação.
Selecione o separador Personalizado .
Pode marcar a status atual de uma regra de classificação ao observar a coluna Estado na tabela.
Selecione a regra de classificação ou várias regras de classificação que pretende ativar ou desativar.
Selecione os botões Ativar ou Desativar no menu superior.
Também pode atualizar a status de uma regra ao editar a regra.
Editar ou eliminar uma regra de classificação
Para atualizar ou editar uma regra de classificação personalizada, siga estes passos:
Na sua conta do Microsoft Purview, selecione o Mapa de dados e, em seguida , Regras de classificação.
Selecione o separador Personalizado .
Selecione a regra de classificação que pretende editar e, em seguida, selecione o botão Editar .
Agora pode editar o estado, a descrição e a regra de classificação associada.
Selecione o botão Continuar .
Pode carregar um novo ficheiro para a sua expressão regular ou regra de dicionário para corresponder e atualizar a correspondência do limiar de correspondência e do padrão da coluna.
Selecione Aplicar para salvar as alterações. As análises terão de ser executadas novamente com a nova regra para aplicar alterações nos seus recursos.
Para eliminar uma classificação personalizada:
Depois de abrir o Mapa de dados e, em seguida, regras de classificação, selecione o separador Personalizado .
Selecione a regra de classificação que pretende eliminar e, em seguida, selecione o botão Eliminar .
Próximas etapas
Agora que criou a regra de classificação, está pronto para ser adicionado a um conjunto de regras de análise para que a análise utilize a regra ao analisar. Para obter mais informações, veja Criar um conjunto de regras de análise.