Introdução à lista de verificação de malha de dados
Durante sua jornada de dados com análises em escala de nuvem, você descobrirá que há vários estágios no seu ciclo de vida de adoção. Esta seção fornece uma lista de verificação de introdução rápida para ajudá-lo a adotar seu cenário em etapas. Estas etapas são:
- Etapa 1: Primeira zona de desembarque
- Etapa 2: Domínios de dados adicionais
- Etapa 3: Melhorar a prontidão para o consumo
- Etapa 4: Componentes críticos de governança
Etapa 1 - Primeira zona de desembarque
- Defina o(s) seu(s) primeiro(s) caso(s) de uso
- Implante sua primeira zona de aterrissagem de gerenciamento de dados
- Implante sua primeira zona de aterrissagem de dados
- Defina o seu primeiro padrão de ingestão (por exemplo, pavimento em lote)
- Desenvolva seu primeiro produto de dados (ingerido cru, abstraído para produto)
- Determinar a governação "suficientemente justa"
- Definir requisitos de metadados (informações do aplicativo, metadados do esquema)
- Registe o seu primeiro consumidor de dados (processo manual)
Etapa 2 - Domínios de dados adicionais
- Refine sua arquitetura de destino
- Implantar mais zonas de aterrissagem de dados
- Estenda com segundo, terceiro e quarto produtos de dados
- Realize seu repositório de metadados do produto de dados (banco de dados ou Excel)
- Implementar seu primeiro conjunto de controles (qualidade de dados, validação de esquema)
- Realize seu pipeline de consumo (tomando entrada como saída)
- Estabelecer a propriedade dos dados
Etapa 3 – Melhorar a prontidão para o consumo
- Implementar registro de autoatendimento e ingestão de metadados
- Oferecer outros padrões de transformação (estrutura de transformação, ferramentas de ETL, etc.)
- Melhorar controles do lado do provedor (glossário, linhagem, conexão)
- Implemente o seu processo de consumo: aprovações, metadados de casos de uso, implemente manualmente vistas seguras
- Estabeleça seu conselho de controle de governança de dados
Etapa 4 – Componentes críticos de governança
- Aplicar automação (provisionamento automático de visualização segura)
- Implante uma forte governança de dados, configure seu órgão de disputa
- Finalize suas diretrizes de produtos de dados
- Defina seu padrão de interoperabilidade extra
- Desenvolva seu processo de consumo de dados de autoatendimento
- Desenvolva seus recursos de consulta de dados, autoatendimento, catálogo, linhagem, etc.
- Desenvolva mais recursos de mercado de dados
Resumo
Esses quatro estágios de desenvolvimento permitem que você configure um produto mínimo viável no estágio um, aprenda e itere no estágio dois. Ao longo de sua abordagem por estágios, você cresce em maturidade para criar uma plataforma de autoatendimento, escalável e governada.