Preços do Mapa de Dados do Microsoft Purview
Este guia aborda as diretrizes de preços do mapa de dados no portal de governação do Microsoft Purview.
Para obter detalhes completos da orientação de preços do Microsoft Purview (anteriormente Azure Purview), veja a descrição geral da orientação de preços.
Para obter detalhes de preços específicos, veja a página de preços do Microsoft Purview (anteriormente Azure Purview). Este artigo irá orientá-lo ao longo das funcionalidades e fatores que irão afetar os preços do Mapa de Dados do Microsoft Purview.
Os custos diretos que afetam os preços dos Mapa de Dados do Microsoft Purview baseiam-se nas três dimensões seguintes:
Mapa de dados elástico
O Mapa de dados é a base da arquitetura do portal de governação do Microsoft Purview, pelo que tem de estar atualizado com as informações dos recursos no património de dados em qualquer momento
O mapa de dados é cobrado em termos de Unidade de Capacidade (). O mapa de dados é aprovisionado numa se o catálogo estiver a armazenar até 10 GB de armazenamento de metadados e servir até 25 operações de mapa de dados/seg
O mapa de dados é sempre aprovisionado numa quando uma conta é criada pela primeira vez
No entanto, o mapa de dados dimensiona automaticamente entre os limites mínimos e máximos dessa janela de elasticidade, para atender a alterações no mapa de dados no que diz respeito a dois fatores-chave : débito de operação e armazenamento de metadados
Débito da operação
- Um fator orientado por eventos com base nas operações Criar, Ler, Atualizar e Eliminar executadas no mapa de dados
- Alguns exemplos das operações do mapa de dados seriam:
- Criar um recurso no Mapa de Dados
- Adicionar uma relação a um recurso, como proprietário, administrador, encarregado de educação, linhagem
- Editar um recurso para adicionar metadados empresariais, como descrição, termo do glossário
- A pesquisa de palavras-chave devolve resultados à página de resultados da pesquisa
- Importar ou exportar informações com a API
- Se existirem várias consultas executadas no Mapa de Dados, o número de operações de E/S também aumenta, o que resulta no aumento vertical do mapa de dados
- O número de utilizadores simultâneos também forma um fator que rege a unidade de capacidade do mapa de dados
- Outros fatores a considerar são o tipo de consulta de pesquisa, interação da API, fluxos de trabalho, aprovações, etc.
- Nível de rajada de dados
- Quando há uma necessidade de mais operações/segundo débito, o Mapa de dados pode dimensionar automaticamente dentro da janela de elasticidade para atender à carga alterada
- Isto constitui a característica de rajada que tem de ser estimada e planeada para
- A característica de rajada compreende o nível de rajada e a duração de rajada para a qual a rajada existe
- O nível de rajada é um índice multiplicativo da elasticidade consistente esperada em estado estável
- A duração da expansão é a percentagem do mês em que tais rajadas (em elasticidade) são esperadas devido ao aumento dos metadados ou ao maior número de operações no mapa de dados
Armazenamento de metadados
- Se o número de recursos reduzir no património de dados e forem removidos no mapa de dados através de análises incrementais subsequentes, o componente de armazenamento reduz automaticamente, pelo que o mapa de dados diminui verticalmente
Análise, classificação e ingestão automatizadas
Existem dois processos automatizados principais que podem acionar a ingestão de metadados no Mapa de Dados do Microsoft Purview:
Análises automáticas com conectores nativos. Este processo inclui três passos main:
- Análise de metadados
- Classificação automática
- Ingestão de metadados no Mapa de Dados do Microsoft Purview
Ingestão automatizada com pipelines Azure Data Factory e/ou Azure Synapse. Esse processo inclui:
- Ingestão de metadados e linhagem na Mapa de Dados do Microsoft Purview se a conta estiver ligada a pipelines Azure Data Factory ou Azure Synapse.
Análises automáticas com conectores nativos
Uma análise completa processa todos os recursos dentro de um âmbito selecionado de uma origem de dados, enquanto uma análise incremental deteta e processa recursos, que foram criados, modificados ou eliminados desde a análise com êxito anterior
Todas as análises (análises completas ou Incrementais) irão recolher recursos atualizados, modificados ou eliminados
É importante considerar e evitar os cenários em que várias pessoas ou grupos pertencentes a diferentes departamentos configuram análises para a mesma origem de dados, o que resulta em mais preços para análise duplicada
Agende análises incrementais frequentes após a análise completa inicial alinhada com as alterações no património de dados. Isto irá garantir que o mapa de dados é sempre mantido atualizado e que as análises incrementais consomem menos horas do v-core em comparação com uma análise completa
A ligação "Ver Detalhes" de uma origem de dados permitirá que os utilizadores executem uma análise completa. No entanto, considere executar análises incrementais após uma análise completa para análise otimizada, exceto quando houver uma alteração ao conjunto de regras de análise (classificações/tipos de ficheiro)
Registe a origem de dados numa coleção principal e analise o âmbito na recolha de menores com diferentes controlos de acesso para garantir que não existem custos de análise duplicados a ser implicados
Reduza os utilizadores que têm permissão para registar origens de dados para análise através do controlo de acesso detalhado e da função de Administrador de Origem de Dados através da Autorização de recolha. Isto irá garantir que apenas as origens de dados válidas estão autorizadas a serem registadas e a análise das horas de v-core é controlada, o que resulta em custos mais baixos para a análise
Considere que o tipo de origem de dados e o número de recursos que estão a ser analisados afetam a duração da análise
Crie conjuntos de regras de análise personalizados para incluir apenas o subconjunto de tipos de ficheiro disponíveis no seu património de dados e classificações que são relevantes para os seus requisitos empresariais para garantir a utilização ideal dos scanners
Ao criar uma nova análise para uma origem de dados, siga a ordem de preparação recomendada antes de executar a análise. Isto inclui a recolha dos requisitos para classificações e tipos de ficheiros específicos da empresa (para contas de armazenamento) para permitir que os conjuntos de regras de análise adequados sejam definidos para evitar múltiplas análises e controlar os custos desnecessários de múltiplas análises através de requisitos perdidos
Alinhe as agendas de análise com o tamanho das VMs (Máquinas Virtuais) Self-Hosted Integration Runtime (SHIR) para evitar custos adicionais ligados a máquinas virtuais
Ingestão automatizada com pipelines Azure Data Factory e/ou Azure Synapse
- Os metadados e a linhagem são ingeridos a partir de pipelines Azure Data Factory ou Azure Synapse sempre que os pipelines são executados no sistema de origem.
Conjuntos de recursos avançados
O Mapa de Dados do Microsoft Purview utiliza conjuntos de recursos para abordar o desafio de mapear um grande número de recursos de dados para um único recurso lógico ao fornecer a capacidade de analisar todos os ficheiros no data lake e encontrar padrões (GUID, padrões de localização, etc.) para agrupá-los como um único recurso no mapa de dados
O Conjunto de Recursos Avançado é uma funcionalidade opcional, que permite que os clientes obtenham informações de conjuntos de recursos melhoradas calculadas, como Tamanho Total, Contagem de Partições, etc., e permite a personalização do agrupamento de conjuntos de recursos através de regras de padrão. Se a funcionalidade Conjunto de Recursos Avançado não estiver ativada, o catálogo de dados continuará a conter recursos do conjunto de recursos, mas sem as propriedades agregadas. Não haverá nenhum medidor "Conjunto de Recursos" faturado ao cliente neste caso.
Utilize a funcionalidade de conjunto de recursos básica, antes de ativar os Conjuntos de Recursos Avançados no Mapa de Dados do Microsoft Purview para verificar se os requisitos são cumpridos
Considere ativar Os Conjuntos de Recursos Avançados se:
- O esquema dos data lakes está em constante mudança e está à procura de mais valor para além da funcionalidade de Conjunto de Recursos básica para permitir que o Mapa de Dados do Microsoft Purview calcule parâmetros como #partitions, tamanho do património de dados, etc., como um serviço
- É necessário personalizar a forma como os recursos do conjunto de recursos são agrupados.
É importante ter em atenção que a faturação dos Conjuntos de Recursos Avançados se baseia na computação utilizada pela camada offline para agregar as informações do conjunto de recursos e depende do tamanho/número de conjuntos de recursos no seu catálogo