Compartir a través de


Guía de decisión de Microsoft Fabric: elección entre Warehouse y Lakehouse

Microsoft Fabric ofrece dos cargas de trabajo de formato estándar abierto a escala empresarial para el almacenamiento de datos: Warehouse y Lakehouse. En este artículo se comparan las dos plataformas y los puntos de decisión de cada uno.

Criterio

diagrama que contiene árboles de decisión para Lakehouse y Warehouse en Microsoft Fabric.

Soluciones sin código o código pro: ¿Cómo desea desarrollarse?

  • Spark
    • Uso de Almacén de lago de datos
  • T-SQL
    • Uso de Almacén

Necesidades de almacenamiento: ¿Necesita transacciones de varias tablas?

    • Uso de Almacén
  • No
    • Uso de Almacén de lago de datos

Complejidad de los datos: ¿Qué tipo de datos está analizando?

  • No sé
    • Uso de Almacén de lago de datos
  • Datos no estructurados y estructurados
    • Uso de Almacén de lago de datos
  • Solo datos estructurados
    • Uso de Almacén

Elección de un servicio candidato

Realice una evaluación detallada del servicio para confirmar que satisface sus necesidades.

El artículo Warehouse en Fabric Data Warehouse es un almacén de datos de escala empresarial con formato estándar abierto.

  • Funcionamiento sin perillas con una configuración e implementación mínimas, sin necesidad de configurar cómputo ni almacenamiento. ​
  • Experiencias de almacenamiento sencillas e intuitivas para profesionales de datos principiantes y experimentados (código no/pro).
  • El almacenamiento centrado en Lake almacena datos en OneLake en formato Delta abierto con fácil recuperación y administración de datos.
  • Totalmente integrado con todas las cargas de trabajo de Fabric.
  • Carga y transformación de datos a escala, con garantías transaccionales completas para múltiples tablas, proporcionadas por el motor SQL.
  • Almacenes virtuales con consultas entre bases de datos y una capa semántica totalmente integrada.
  • Plataforma preparada para la empresa con visibilidad de uso y rendimiento integral, con gobernanza y seguridad integradas.
  • Flexibilidad para compilar el almacenamiento de datos o la malla de datos en función de las necesidades de la organización y la elección de código sin código, código bajo o T-SQL para las transformaciones.

El elemento Lakehouse de Fabric Data Engineering es una plataforma de arquitectura de datos para almacenar, administrar y analizar datos estructurados y no estructurados en una sola ubicación.

  • Almacene, administre y analice datos estructurados y no estructurados en una sola ubicación para obtener información y tomar decisiones de forma más rápida y eficaz.
  • Solución flexible y escalable que permite a las organizaciones controlar grandes volúmenes de datos de todos los tipos y tamaños.
  • Ingerir fácilmente datos de muchos orígenes diferentes, que se convierten en un formato Delta unificado
  • Detección automática de tablas y registro para una experiencia de archivo a tabla totalmente administrada para ingenieros de datos y científicos de datos. ​
  • Punto de conexión automático de SQL Analytics y conjunto de datos predeterminado que permite la consulta T-SQL de tablas delta en el lago

Ambos se incluyen en las capacidades de Power BI Premium o Fabric.

Comparación de diferentes funcionalidades de almacenamiento

En esta tabla se compara el almacén con el punto de conexión de SQL Analytics de almacén de lago de datos.

Oferta de Microsoft Fabric

Warehouse

Punto de conexión de análisis SQL del almacén de lago


Funcionalidades principales

Almacenamiento de datos completo y compatible con ACID con compatibilidad con transacciones en T-SQL.

Solo lectura, punto de conexión de análisis SQL generado por el sistema para el almacén de lago para consultas y servicios de T-SQL. Admite el análisis en las tablas Delta de Lakehouse y las carpetas de Delta Lake a las que se hace referencia mediante accesos directos.


Perfil de desarrollador

Desarrolladores de SQL o desarrolladores ciudadanos

Ingenieros de datos o desarrolladores de SQL


Carga de datos

SQL, canalizaciones, flujos de datos

Spark, canalizaciones, flujos de datos, accesos directos


Compatibilidad con tablas delta

Lee y escribe tablas Delta

Lee tablas delta.


Capa de almacenamiento

Formato de datos abiertos: Delta

Formato de datos abiertos: Delta


Caso de uso recomendado

  • Almacenamiento de datos para uso empresarial
  • Almacenamiento de datos que admite el uso departamental, de unidad de negocio o de autoservicio.
  • Análisis de datos estructurados en T-SQL con tablas, vistas, procedimientos y funciones y compatibilidad avanzada con SQL para BI
  • Exploración y consulta de tablas delta desde el almacén de lago
  • Preparación de datos y zona de archivo para análisis
  • Arquitectura de medallón del almacén de lago con zonas para el análisis de bronce, plata y oro
  • Emparejamiento con Almacén de Datos para casos de uso en análisis empresarial

Experiencia de desarrollo

  • Editor de almacén con compatibilidad completa para la ingesta de datos T-SQL, el modelado, el desarrollo y la consulta, ofreciendo interfaces de usuario para estas funciones.
  • Compatibilidad de lectura y escritura para herramientas de primera y tercera partes
  • Punto de conexión de análisis SQL del almacén de lago con compatibilidad limitada con T-SQL para vistas, funciones con valores de tabla y consultas SQL
  • Experiencias de interfaz de usuario para el modelado y la consulta
  • Soporte limitado de T-SQL para herramientas de primera y de terceros.

Funcionalidades de T-SQL

Compatibilidad completa con DQL, DML y DDL T-SQL, compatibilidad completa con transacciones

Compatibilidad con T-SQL con DQL completo, sin DML, con DDL limitado, como vistas SQL y TVF