Compartir vía


Creación de reflejo de Snowflake en Microsoft Fabric

La creación de reflejos en Fabric proporciona una experiencia sencilla para evitar ETL (extracción carga transformación) compleja e integrar los datos de almacenamiento de Snowflake existentes con el resto de los datos en Microsoft Fabric. Puede replicar continuamente los datos existentes de Snowflake directamente en OneLake de Fabric. Dentro de Fabric, puede desbloquear potentes escenarios de inteligencia empresarial, inteligencia artificial, Ingeniería de datos, Ciencia de datos y uso compartido de datos.

A fin de ver un tutorial sobre cómo configurar la base de datos de Snowflake para la creación de reflejo en Fabric, consulta Tutorial: Configuración de bases de datos reflejadas de Microsoft Fabric desde Snowflake.

¿Por qué conviene usar la creación de reflejos en Fabric?

Con Creación de reflejo en Fabric, no es necesario agrupar diferentes servicios de varios proveedores. En su lugar, puede disfrutar de un producto altamente integrado, de un extremo a otro y fácil de usar, que ha sido diseñado para simplificar las necesidades de análisis y creado para la apertura y colaboración entre Microsoft, Snowflake y miles de soluciones tecnológicas que pueden leer el formato de tabla de Delta Lake de código abierto.

¿Qué experiencias de análisis se crean?

Los catálogos reflejados son un elemento de Almacenamiento de datos de Fabric distinto de los elementos de punto de conexión de análisis SQL y Almacén.

Diagrama de creación de reflejo de la base de datos de Fabric para Snowflake.

La creación de reflejo crea tres elementos en el área de trabajo de Fabric:

Cada base de datos reflejada tiene un punto de conexión de análisis SQL generado automáticamente que proporciona una experiencia analítica enriquecida sobre las tablas Delta que crea el proceso de creación de reflejo. Los usuarios tienen acceso a comandos de T-SQL conocidos que pueden definir y consultar objetos de datos, pero no manipular los datos desde el punto de conexión de análisis SQL, ya que es una copia de solo lectura. Puede realizar las siguientes acciones en el punto de conexión de análisis SQL:

  • Explore las tablas que hacen referencia a datos de las tablas de Delta Lake desde Snowflake.
  • Cree consultas y vistas sin código y explore los datos visualmente sin escribir una línea de código.
  • Cree vistas SQL, TVF insertadas (funciones con valores de tabla) y procedimientos almacenados para encapsular la semántica y la lógica de negocios en T-SQL.
  • Administre los permisos en los objetos.
  • Consulte los datos de otros almacenes e instancias de Lakehouse en la misma área de trabajo.

Además del editor de consultas SQL, hay un amplio ecosistema de herramientas que puede consultar el punto de conexión de análisis de SQL, incluido SQL Server Management Studio (SSMS), la extensión mssql con Visual Studio Code, e incluso GitHub Copilot.

Consideraciones sobre la seguridad

Para habilitar la creación de reflejo de Fabric, necesitará permisos de usuario para la base de datos de Snowflake que contenga los permisos siguientes:

  • CREATE STREAM
  • SELECT table
  • SHOW tables
  • DESCRIBE tables

Para obtener más información, consulte la documentación de Snowflake sobre Privilegios de control de acceso para tablas de streaming y Permisos necesarios para flujos.

Importante

Cualquier seguridad pormenorizada establecida en el almacén de Snowflake de origen debe volver a configurarse en la base de datos reflejada en Microsoft Fabric. Para más información, consulte Permisos pormenorizados de SQL en Microsoft Fabric.

Consideraciones sobre los costos de Snowflake reflejado

Fabric no cobra por las tarifas de entrada de datos de red en OneLake para la creación de reflejo. No hay costos de creación de reflejo cuando los datos de Snowflake se replican en OneLake.

Hay costos de proceso y consulta en la nube de Snowflake cuando se reflejan los datos: proceso de almacenamiento virtual y proceso de servicios en la nube.

  • Cargos de proceso de almacenamiento virtual de Snowflake:
    • Los cargos de proceso se cobrarán en el lado de Snowflake si hay cambios en los datos que se leen en Snowflake y, a su vez, se crea un reflejo en Fabric.
    • Las consultas de metadatos que se ejecutan en segundo plano para comprobar si hay cambios en los datos no se cobran para ningún proceso de Snowflake, pero las consultas que producen datos como, por ejemplo, SELECT *, reactivarán el almacenamiento de Snowflake y el proceso se cobrará.
  • Cargos de proceso de los servicios de Snowflake:
    • Aunque no hay cargos de proceso por tareas en segundo plano, como la creación, las consultas de metadatos, el control de acceso, la visualización de los cambios de datos e incluso las consultas DDL, hay costos en la nube asociados a estas consultas.
    • En función del tipo de edición de Snowflake que tenga, se le cobrarán los créditos correspondientes por los costos de los servicios en la nube.

En la captura de pantalla siguiente, puede ver los costos de proceso de almacenamiento virtual y servicios en la nube para la base de datos de Snowflake asociada que se está reflejando en Fabric. En este escenario, la mayoría de los costes de proceso de los servicios en la nube (en amarillo) proceden de consultas de cambio de datos basadas en los puntos mencionados anteriormente. Los cargos de proceso de almacenamiento virtual (en azul) proceden estrictamente de los cambios de datos que se leen de Snowflake y se reflejan en Fabric.

Captura de pantalla del gráfico de costos de Snowflake.

Para obtener más información sobre los costos específicos de las consultas en la nube de Snowflake, consulte Documentación de Snowflake: Descripción del costo general.

Paso siguiente