Compartir vía


Guía de decisión de Microsoft Fabric: elegir entre Almacén y Almacén de lago

Microsoft Fabric ofrece dos cargas de trabajo de formato estándar abierto y a escala empresarial para el almacenamiento de datos: Almacén y Almacén de lago. En este artículo se comparan las dos plataformas y los puntos de decisión de cada una.

Criterio

Diagrama que contiene árboles de decisión para el Almacén de lago y el Almacén en Microsoft Fabric.

Sin código o soluciones de Pro Code: ¿cómo desea desarrollar el contenido?

  • Spark
    • Usar Almacén de lago
  • T-SQL
    • Usar Almacén

Necesidades de almacenamiento: ¿necesita realizar transacciones de varias tablas?

    • Usar Almacén
  • No
    • Usar Almacén de lago

Complejidad de los datos: ¿qué tipo de datos está analizando?

  • No lo sé
    • Usar Almacén de lago
  • Datos no estructurados y estructurados
    • Usar Almacén de lago
  • Solo datos estructurados
    • Usar Almacén

Elección de un servicio candidato

A continuación, realice una evaluación detallada del servicio para ver si satisface sus necesidades.

El elemento Warehouse de Fabric Data Warehouse es un almacenamiento de datos de escala empresarial con formato estándar abierto.

  • No hay rendimiento de botones con una configuración e implementación mínimas, ni existe la necesidad de configurar el proceso ni el almacenamiento. ​
  • Experiencias de almacenamiento sencillas e intuitivas para profesionales de datos principiantes y experimentados (código no/pro).
  • El almacenamiento centrado en el Lago almacena datos en OneLake en formato Delta abierto y ofrece una recuperación y administración fácil de los datos.
  • Está totalmente integrado con todas las cargas de trabajo de Fabric.
  • Carga y transformaciones de datos a escala, con garantías transaccionales completas de varias tablas proporcionadas por el motor de SQL.
  • Almacenes virtuales con consultas entre bases de datos y una capa semántica totalmente integrada.
  • Plataforma preparada para la empresa con visibilidad de uso y rendimiento integral, con gobernanza y seguridad integradas.
  • Flexibilidad para compilar el almacenamiento de datos o la malla de datos en función de las necesidades de la organización; ofrece la opción de elegir el código, no usar código, usar poco código o T-SQL en las transformaciones.

El elemento Lakehouse de Fabric Data Engineering es una plataforma de arquitectura de datos para almacenar, administrar y analizar datos estructurados y no estructurados en una sola ubicación.

  • Almacene, administre y analice datos estructurados y no estructurados en una sola ubicación para obtener información y tomar decisiones de forma más rápida y eficaz.
  • Solución flexible y escalable que permite a las organizaciones controlar grandes volúmenes de datos de todos los tipos y tamaños.
  • Ingiera fácilmente datos de varios orígenes diferentes, y conviértalos en un formato Delta unificado.
  • Detección y registro automático de tablas para obtener una experiencia de archivo a tabla totalmente administrada para ingenieros y científicos de datos. ​
  • Punto de conexión automático de análisis SQL y un conjunto de datos predeterminado que permite la consulta T-SQL de tablas delta en el lago

Ambos se incluyen en las capacidades de Power BI Premium o Fabric.

Comparación de diferentes funcionalidades de almacenamiento

Esta tabla compara el almacén con el punto de conexión de análisis SQL de Lakehouse.

Oferta de Microsoft Fabric

Almacén

Punto de conexión de análisis SQL del almacén de lago


Funcionalidades principales

Compatible con ACID, almacenamiento de datos completo con compatibilidad con transacciones en T-SQL.

Solo lectura, punto de conexión de análisis SQL generado por el sistema para el almacén de lago para consultas y servicios de T-SQL. Admite el análisis en las tablas Delta de Lakehouse y las carpetas de Delta Lake a las que se hace referencia mediante accesos directos.


Perfil del desarrollador

Desarrolladores de SQL o desarrolladores civiles

Ingenieros de datos o desarrolladores de SQL


Carga de datos

SQL, canalizaciones, flujos de datos

Spark, canalizaciones, flujos de datos, accesos directos


Compatibilidad con tablas delta

Lee y escribe tablas delta

Lee tablas delta


Capa de almacenamiento

Formato de datos abiertos: Delta

Formato de datos abiertos: Delta


Caso de uso recomendado

  • Almacenamiento de datos para uso empresarial
  • Almacenamiento de datos que admite el uso departamental, de unidad de negocio o autoservicio
  • Análisis de datos estructurados en T-SQL con tablas, vistas, procedimientos y funciones, y compatibilidad con SQL avanzado para BI
  • Exploración y consulta de tablas delta desde el almacén de lago
  • Almacenamiento provisional de datos y zona de archivado para el análisis
  • Arquitectura de medallón del almacén de lago con zonas para el análisis de bronce, plata y oro
  • Emparejamiento con instancias de Warehouse para casos de uso de análisis empresarial

Experiencia de desarrollo

  • Editor de Warehouse con compatibilidad completa con experiencias de interfaz de usuario de ingesta, modelado, desarrollo y consulta de datos de T-SQL para la ingesta, el modelado y la consulta de datos
  • Compatibilidad de lectura y escritura para herramientas propias y de terceros
  • Punto de conexión de análisis SQL del almacén de lago con compatibilidad limitada con T-SQL para vistas, funciones con valores de tabla y consultas SQL
  • Experiencias de interfaz de usuario para el modelado y la consulta
  • Compatibilidad limitada con T-SQL para herramientas propias y de terceros

Funcionalidades de T-SQL

Compatibilidad completa con DQL, DML y DDL T-SQL, compatibilidad completa con transacciones

Compatibilidad con T-SQL con DQL completo, sin DML, con DDL limitado, como vistas SQL y TVF