Introdução à lista de verificação da malha de dados
Durante o seu percurso de dados com a análise em escala de nuvem, você descobrirá que existem várias fases no ciclo de vida da adoção. Esta seção fornece uma lista de verificação de introdução rápida para ajudá-lo a adotar seu cenário em estágios. Estes estágios são:
- Estágio 1: Primeira zona de destino
- Estágio 2: Domínios de dados adicionais
- Estágio 3: Melhorar a preparação para o consumo
- Estágio 4: Componentes de governança críticos
Estágio 1 – Primeira zona de destino
- Definir seus primeiros casos de uso
- Implantar sua primeira zona de destino de gerenciamento de dados
- Implantar sua primeira zona de destino de dados
- Definir seu primeiro padrão de ingestão (por exemplo, parquet em lote)
- Desenvolva seu primeiro produto de dados (dados brutos ingeridos, abstraído para produto)
- Determinar a governança 'just enough"
- Definir requisitos de metadados (informações do aplicativo, metadados de esquema)
- Registrar seu primeiro consumidor de dados (processo manual)
Estágio 2 – Domínios de dados adicionais
- Refinar sua arquitetura de destino
- Implantar mais zonas de destino de dados
- Estender com segundo, terceiro e quarto produtos de dados
- Realize o repositório de metadados do produto de dados (banco de dados ou Excel)
- Implementar seu primeiro conjunto de controles (qualidade dos dados, validação de esquema)
- Realize seu pipeline de consumo (usando a entrada como saída)
- Estabelecer a propriedade de dados
Estágio 3 – Melhorar a preparação para o consumo
- Implementar registro de autoatendimento e ingestão de metadados
- Oferecer outros padrões de transformação (estrutura de transformação, ferramentas ETL etc.)
- Enriquecer controles no lado do provedor (glossário, linhagem, vinculação)
- Implementar seu processo de consumo: aprovações, metadados de casos de uso, implantar exibições seguras manualmente
- Estabelecer seu quadro de controle de governança de dados
Estágio 4 – Componentes de governança críticos
- Aplicar automação (provisionamento automático de visualização segura)
- Estabelecer uma forte governança de dados, configurar seu órgão de resolução de disputas
- Finalizar as diretrizes do produto de dados
- Definir seu padrão de interoperabilidade extra
- Desenvolva seu processo de consumo de dados self-service
- Desenvolva sua consulta de dados, autoatendimento, catálogo, recursos de linhagem etc.
- Desenvolver mais recursos do marketplace de dados
Resumo
Esses quatro estágios de desenvolvimento permitem que você configure um produto viável mínimo na primeira fase, aprenda e itere na fase dois. Ao longo de sua abordagem por etapas, você cresce em maturidade para criar uma plataforma de autoatendimento, escalável e governada.