Introducción a las arquitecturas
Antes de empezar a crear las arquitecturas de datos del marco de análisis a escala de la nube, revise los artículos de la tabla siguiente.
Sección | Descripción |
---|---|
Creación de una estrategia inicial | Cómo crear la estrategia de datos y dinamizar para convertirse en una organización guiada por datos. |
Definición del plan | Desarrollo de un plan para el análisis a escala de la nube. |
Preparación del estado de análisis | Descripción general de la preparación de su entorno analítico a escala de la nube con consideraciones clave del área de diseño, como la inscripción de la empresa, las redes, la administración de identidades y accesos, las políticas, la continuidad del negocio y la recuperación ante desastres. |
Gobernanza del análisis | Requisitos para gobernar los datos, el catálogo de datos, el linaje, la administración de datos maestros, la calidad de los datos, los contratos de uso compartido de datos y los metadatos. |
Asegurar el estado del análisis | Protección del estado de análisis con autenticación y autorización, privacidad de datos y administración del acceso a datos. |
Organización de personas y equipos | Cómo organizar operaciones, roles, equipos y funciones de equipo eficaces. |
Administración del estado del análisis | Cómo aprovisionar la plataforma y la observabilidad de un escenario. |
Arquitectura física
La implementación física del análisis de escala de la nube consta de dos arquitecturas principales: la zona de aterrizaje de administración de datos y la zona de aterrizaje de datos.
Aplicaciones de datos
Las aplicaciones de datos son un concepto básico para entregar un producto de datos y se pueden alinear con patrones de malla de datos y de lakehouse.
Análisis a escala de nube
Puede escalar la implementación de análisis a escala de la nube mediante varias zonas de aterrizaje de datos.
Malla de datos
Implemente la malla de datos mediante el análisis a escala de la nube. Aunque se aplican la mayoría de las instrucciones de análisis a escala de la nube, hay que tener en cuenta algunas diferencias sobre los dominios de datos, las plataformas de datos de autoservicio, la incorporación de productos de datos, la gobernanza, el marketplace de datos y el uso compartido de datos.
Plantillas de implementación para los análisis a escala de la nube
En la tabla siguiente se enumeran las plantillas de referencia que puede implementar.
Repositorio | Contenido | Obligatorio | Modelo de implementación |
---|---|---|---|
Plantilla de administración de datos | Servicios centrales de administración de datos y servicios de datos compartidos, como el catálogo de datos y el entorno de ejecución de integración auto-hospedado | Sí | Uno por cada análisis a escala de la nube |
Plantilla de zona de aterrizaje de datos | Servicios compartidos de zonas de aterrizaje de datos, incluidos los servicios de ingesta, administración y almacenamiento de datos | Sí | Uno por zona de aterrizaje de datos |
Plantilla de integración de datos: procesamiento por lotes | Servicios adicionales necesarios para el procesamiento de datos por lotes | No | Uno o más por zona de aterrizaje de datos |
Plantilla de integración de datos: procesamiento de flujos | Servicios adicionales necesarios para el procesamiento de flujos de datos | No | Uno o más por zona de aterrizaje de datos |
Plantilla de producto de datos: análisis y ciencia de datos | Servicios adicionales necesarios para el análisis de datos y la IA | No | Uno o más por zona de aterrizaje de datos |
Estas plantillas contienen plantillas de Azure Resource Manager y sus archivos de parámetros, así como definiciones de canalizaciones de CI/CD para la implementación de recursos.
Las plantillas pueden cambiar con el tiempo, en función de los nuevos servicios y requisitos de Azure. Proteja la rama principal de cada repositorio, para conservarla sin errores y lista para su consumo e implementación. Use una suscripción de desarrollo para probar los cambios de configuración de la plantilla, antes de combinar de nuevo las mejoras de características en la rama principal.
Conexión a entornos de forma privada
La arquitectura de referencia es segura por diseño. Usa un enfoque de seguridad multicapa para superar los riesgos comunes de filtración de datos.
La solución de seguridad más sencilla es hospedar un jumpbox, en la red virtual de la zona de aterrizaje de administración de datos o de la zona de aterrizaje de datos, para conectarse a los servicios de datos mediante puntos de conexión privados.
Preguntas más frecuentes
Para obtener una lista de preguntas y respuestas sobre el análisis a escala de la nube, consulte Preguntas más frecuentes.
Pasos siguientes
Introducción a la zona de aterrizaje de administración de datos del análisis a escala de la nube