Introducción: lista de comprobación
Durante el recorrido de sus datos con el análisis a escala de la nube, verá que el ciclo de vida de adopción tiene varias fases. En esta sección se proporciona una lista de comprobación introductoria y rápida, para ayudarle a adoptar su escenario en fases. Estas fases son:
- Fase 1: primera zona de aterrizaje
- Fase 2: dominios de datos adicionales
- Fase 3: mejora de la preparación del consumo
- Fase 4: componentes críticos de gobernanza
Fase 1: primera zona de aterrizaje
- Definición de los primeros casos de uso
- Implementación de la primera zona de aterrizaje de administración de datos
- Implementación de la primera zona de aterrizaje de datos
- Definición del primer patrón (de ingesta) (por ejemplo, parquet por lotes)
- Desarrollo del primer producto de datos (ingerido sin procesar, independiente del producto)
- Determinar la gobernanza "just-enough"
- Definición de los requisitos de metadatos (información de la aplicación, metadatos de esquema)
- Registro del primer consumidor de datos (proceso manual)
Fase 2: dominios de datos adicionales
- Refinar la arquitectura de destino
- Implementación de más zonas de aterrizaje de datos
- Ampliación con los productos de datos segundo, tercero y cuarto
- Realización del repositorio de metadatos del producto de datos (base de datos o Excel)
- Implementación del primer conjunto de controles (calidad de datos, validación de esquemas)
- Realización de la canalización de consumo (tomando la entrada como salida)
- Establecimiento de la propiedad de los datos
Fase 3: mejora de la preparación del consumo
- Implementación del registro de autoservicio y la ingesta de metadatos
- Ofrecer otros patrones de transformación (marco de transformación, herramientas de ETL, etc.)
- Enriquecer controles en el lado del proveedor (glosario, linaje, vinculación)
- Implementación del proceso de consumo: aprobaciones, metadatos de casos de uso, implementación de vistas seguras a mano
- Establecimiento del comité de control de gobernanza de datos
Fase 4: componentes críticos de gobernanza
- Aplicación de automatización (aprovisionamiento automático de vistas seguras)
- Implementación de una gobernanza de datos sólida, configuración de un órgano para resolver disputas
- Finalización de las directrices del producto de datos
- Definición del estándar de interoperabilidad adicional
- Desarrollo del proceso de consumo de datos de autoservicio
- Desarrollo de la consulta de datos, el autoservicio, el catálogo, las capacidades de linaje, etc.
- Desarrollo de más capacidades del marketplace de datos.
Resumen
Estas cuatro fases de desarrollo permiten configurar lo mínimo para que el producto sea viable en la fase uno, y así aprender y pasar a la iteración en la fase dos. A lo largo del enfoque dividido en fases, irá ganando en madurez para crear una plataforma de autoservicio, escalable y gobernada.