Tutorial: Configuración de bases de datos reflejadas de Microsoft Fabric desde Azure Databricks (versión preliminar)
La creación de reflejo de la base de datos en Microsoft Fabric es una tecnología empresarial, basada en la nube, cero ETL y SaaS. Esta guía le ayuda a establecer una base de datos reflejada de Azure Databricks, que crea una copia de solo lectura y replicada continuamente de los datos de Azure Databricks en OneLake.
Requisitos previos
Cree o use un área de trabajo de Azure Databricks existente con el catálogo de Unity habilitado.
Debe tener el
EXTERNAL USE SCHEMA
privilegio en el esquema del catálogo de Unity que contiene las tablas a las que se tendrá acceso desde Fabric. Para obtener más información, consulte Control del acceso externo a los datos en el catálogo de Unity.Debe usar el modelo de permisos de Fabric para establecer controles de acceso para catálogos, esquemas y tablas en Fabric.
Las áreas de trabajo de Azure Databricks no deben estar detrás de un punto de conexión privado.
Las cuentas de almacenamiento que contienen datos del Catálogo de Unity no pueden estar detrás de un firewall.
Creación de una base de datos reflejada desde Azure Databricks
Siga estos pasos para crear una nueva base de datos reflejada desde el catálogo de Unity de Azure Databricks.
Vaya a https://powerbi.com.
Seleccione + New (+ Nuevo ) y, a continuación, mirrored Azure Databricks catalog (Catálogo de Azure Databricks reflejado).
Seleccione una conexión existente si tiene una configurada.
- Si no tiene una conexión existente, cree una nueva conexión y escriba todos los detalles. Puede autenticarse en el área de trabajo de Azure Databricks mediante "Cuenta organizativa" o "Entidad de servicio". Para crear una conexión, debe ser un usuario o un administrador del área de trabajo de Azure Databricks.
Una vez que se conecte a un área de trabajo de Azure Databricks, en la página Elegir tablas de un catálogo de Databricks, podrá seleccionar el catálogo, los esquemas y las tablas a través de la lista de inclusión y exclusión que desea agregar y acceder desde Microsoft Fabric. Elija el catálogo y sus esquemas y tablas relacionados que quiera agregar al área de trabajo de Fabric.
- Solo puede ver los catálogos, esquemas y tablas a los que tiene acceso según los privilegios que se les conceden según el modelo de privilegios descrito en Privilegios del catálogo de Unity y objetos protegibles.
- De forma predeterminada, se habilita la sincronización automática de cambios futuros del catálogo para el esquema seleccionado. Para más información, consulte Creación de reflejo del catálogo de Unity de Azure Databricks (versión preliminar).
- Cuando haya realizado las selecciones, seleccione Siguiente.
De forma predeterminada, el nombre del elemento será el nombre del catálogo que intenta agregar a Fabric. En la página Revisar y crear , puede revisar los detalles y, opcionalmente, cambiar el nombre del elemento de base de datos reflejado, que debe ser único en el área de trabajo. Seleccione Crear.
También se crea un elemento de catálogo de Databricks y, para cada tabla, también se crea un acceso directo de tipo de Databricks correspondiente.
- Los esquemas que no tienen ninguna tabla no se mostrarán.
También puede ver una vista previa de los datos al acceder a un acceso directo seleccionando el punto de conexión de SQL Analytics. Abra el elemento punto de conexión de SQL Analytics para iniciar la página Explorador y Editor de consultas. Puede consultar las tablas reflejadas de Azure Databricks con T-SQL en el Editor de SQL.
Creación de accesos directos de Lakehouse al elemento de catálogo de Databricks
También puede crear accesos directos desde Lakehouse al elemento de catálogo de Databricks para usar los datos de Lakehouse y usar Cuadernos de Spark.
- En primer lugar, creamos una casa de lago. Si ya tiene una instancia de Lakehouse en esta área de trabajo, puede usar una instancia de Lakehouse existente.
- Seleccione el área de trabajo en el menú de navegación.
- Selecciona + Nuevo>Almacén de lago.
- Proporcione un nombre para lakehouse en el campo Nombre y seleccione Crear.
- En la vista Explorador de su instancia de Lakehouse, en el menú Obtener datos del lago, en Cargar datos en el lago, seleccione el botón Nuevo acceso directo.
- Seleccione Microsoft OneLake. Seleccione un catálogo. Este es el elemento de datos que creó en los pasos anteriores. Seleccione Siguiente.
- Seleccione tablas en el esquema y seleccione Siguiente.
- Seleccione Crear.
- Los accesos directos ahora están disponibles en Lakehouse para usarlos con los demás datos de Lakehouse. También puede usar Cuadernos y Spark para realizar el procesamiento de datos en los datos de estas tablas de catálogo que agregó desde el área de trabajo de Azure Databricks.
Crear un modelo semántico
Sugerencia
Para obtener la mejor experiencia, se recomienda usar el explorador Microsoft Edge para tareas de modelado semántico.
Obtenga más información sobre el modelo semántico de Power BI predeterminado.
Además del modelo semántico de Power BI predeterminado, tiene la opción de actualizar el modelo semántico predeterminado de Power BI si decide agregar o quitar tablas del modelo o crear un nuevo modelo semántico. Para actualizar el modelo semántico predeterminado:
- Vaya al elemento de Azure Databricks reflejado en el área de trabajo.
- Seleccione el punto de conexión de SQL Analytics en la lista desplegable de la barra de herramientas.
- En Informes, seleccione Administrar modelo semántico predeterminado.
Administración de las relaciones del modelo semántico
- Seleccione Diseños de modelo en el Explorador del área de trabajo.
- Una vez seleccionados los diseños de modelo, se le presenta un gráfico de las tablas que se han incluido como parte del modelo semántico.
- Para crear relaciones entre tablas, arrastre un nombre de columna de una tabla a otro nombre de columna de otra tabla. Se presenta un elemento emergente para identificar la relación y la cardinalidad de las tablas.