Guía de decisión de Microsoft Fabric: elección entre Warehouse y Lakehouse
Microsoft Fabric ofrece dos cargas de trabajo de formato estándar abierto a escala empresarial para el almacenamiento de datos: Warehouse y Lakehouse. En este artículo se comparan las dos plataformas y los puntos de decisión de cada uno.
Criterio
Soluciones sin código o código pro: ¿Cómo desea desarrollarse?
- Spark
- Uso de Almacén de lago de datos
- T-SQL
- Uso de Almacén
Necesidades de almacenamiento: ¿Necesita transacciones de varias tablas?
- Sí
- Uso de Almacén
- No
- Uso de Almacén de lago de datos
Complejidad de los datos: ¿Qué tipo de datos está analizando?
- No sé
- Uso de Almacén de lago de datos
- Datos no estructurados y estructurados
- Uso de Almacén de lago de datos
- Solo datos estructurados
- Uso de Almacén
Elección de un servicio candidato
Realice una evaluación detallada del servicio para confirmar que satisface sus necesidades.
El artículo Warehouse en Fabric Data Warehouse es un almacén de datos de escala empresarial con formato estándar abierto.
- Funcionamiento sin perillas con una configuración e implementación mínimas, sin necesidad de configurar cómputo ni almacenamiento.
- Experiencias de almacenamiento sencillas e intuitivas para profesionales de datos principiantes y experimentados (código no/pro).
- El almacenamiento centrado en Lake almacena datos en OneLake en formato Delta abierto con fácil recuperación y administración de datos.
- Totalmente integrado con todas las cargas de trabajo de Fabric.
- Carga y transformación de datos a escala, con garantías transaccionales completas para múltiples tablas, proporcionadas por el motor SQL.
- Almacenes virtuales con consultas entre bases de datos y una capa semántica totalmente integrada.
- Plataforma preparada para la empresa con visibilidad de uso y rendimiento integral, con gobernanza y seguridad integradas.
- Flexibilidad para compilar el almacenamiento de datos o la malla de datos en función de las necesidades de la organización y la elección de código sin código, código bajo o T-SQL para las transformaciones.
El elemento Lakehouse de Fabric Data Engineering es una plataforma de arquitectura de datos para almacenar, administrar y analizar datos estructurados y no estructurados en una sola ubicación.
- Almacene, administre y analice datos estructurados y no estructurados en una sola ubicación para obtener información y tomar decisiones de forma más rápida y eficaz.
- Solución flexible y escalable que permite a las organizaciones controlar grandes volúmenes de datos de todos los tipos y tamaños.
- Ingerir fácilmente datos de muchos orígenes diferentes, que se convierten en un formato Delta unificado
- Detección automática de tablas y registro para una experiencia de archivo a tabla totalmente administrada para ingenieros de datos y científicos de datos.
- Punto de conexión automático de SQL Analytics y conjunto de datos predeterminado que permite la consulta T-SQL de tablas delta en el lago
Ambos se incluyen en las capacidades de Power BI Premium o Fabric.
Comparación de diferentes funcionalidades de almacenamiento
En esta tabla se compara el almacén con el punto de conexión de SQL Analytics de almacén de lago de datos.
Oferta de Microsoft Fabric
Warehouse
Punto de conexión de análisis SQL del almacén de lago
Funcionalidades principales
Almacenamiento de datos completo y compatible con ACID con compatibilidad con transacciones en T-SQL.
Solo lectura, punto de conexión de análisis SQL generado por el sistema para el almacén de lago para consultas y servicios de T-SQL. Admite el análisis en las tablas Delta de Lakehouse y las carpetas de Delta Lake a las que se hace referencia mediante accesos directos.
Perfil de desarrollador
Desarrolladores de SQL o desarrolladores ciudadanos
Ingenieros de datos o desarrolladores de SQL
Carga de datos
SQL, canalizaciones, flujos de datos
Spark, canalizaciones, flujos de datos, accesos directos
Compatibilidad con tablas delta
Lee y escribe tablas Delta
Lee tablas delta.
Capa de almacenamiento
Formato de datos abiertos: Delta
Formato de datos abiertos: Delta
Caso de uso recomendado
- Almacenamiento de datos para uso empresarial
- Almacenamiento de datos que admite el uso departamental, de unidad de negocio o de autoservicio.
- Análisis de datos estructurados en T-SQL con tablas, vistas, procedimientos y funciones y compatibilidad avanzada con SQL para BI
- Exploración y consulta de tablas delta desde el almacén de lago
- Preparación de datos y zona de archivo para análisis
- Arquitectura de medallón del almacén de lago con zonas para el análisis de bronce, plata y oro
- Emparejamiento con Almacén de Datos para casos de uso en análisis empresarial
Experiencia de desarrollo
- Editor de almacén con compatibilidad completa para la ingesta de datos T-SQL, el modelado, el desarrollo y la consulta, ofreciendo interfaces de usuario para estas funciones.
- Compatibilidad de lectura y escritura para herramientas de primera y tercera partes
- Punto de conexión de análisis SQL del almacén de lago con compatibilidad limitada con T-SQL para vistas, funciones con valores de tabla y consultas SQL
- Experiencias de interfaz de usuario para el modelado y la consulta
- Soporte limitado de T-SQL para herramientas de primera y de terceros.
Funcionalidades de T-SQL
Compatibilidad completa con DQL, DML y DDL T-SQL, compatibilidad completa con transacciones
Compatibilidad con T-SQL con DQL completo, sin DML, con DDL limitado, como vistas SQL y TVF