Cómo: Crear una base de datos de lago a partir de una plantilla de base de datos de lago
En este artículo, aprenderá a usar las plantillas de base de Azure Synapse para simplificar la creación de una base de datos de lago. El uso de plantillas de bases de datos proporciona a su base de datos una rica información semántica, lo que permite a los usuarios finales de los datos comprender más fácilmente qué datos están disponibles y cómo usarlos.
Prerrequisitos
- Se requieren al menos permisos de rol de usuario de Synapse para explorar una plantilla de base de datos de lago desde la Galería.
- Se requieren permisos de administrador o colaborador de Synapse en el área de trabajo de Synapse para crear una base de datos de lago.
- Los permisos de colaborador de datos de blobs de almacenamiento son necesarios en el lago de datos al usar la opción Desde el lago de datos de creación de tablas.
Creación de una base de datos de lago a partir de una plantilla de base de datos
- En el centro Inicio del área de trabajo de Azure Synapse Analytics, seleccione Centro de conocimientos y, a continuación, Examinar galería. Llegará a la pestaña Plantillas de base de datos de lago.
- En la categoría Plantillas de base de datos de lago se enumeran las plantillas de base de datos estandarizadas disponibles para un sector específico.
- También puede visitar la pestaña Plantillas de base de datos de Lake en el centro de datos, + Agregar nuevo recurso, menú Examinar galería.
- Seleccione el sector que le interesa (por ejemplo, Retail) y seleccione Continuar para ir a la exploración del modelo de datos.
- Llegará al lienzo de la base de datos y podrá explorar las tablas disponibles en la plantilla. De forma predeterminada, el lienzo mostrará una selección de las tablas más usadas en esa plantilla. El lienzo tiene varias herramientas que le ayudarán a navegar por el diagrama de relación de entidad.
- Hacer zoom de ajuste para ajustar todas las tablas del lienzo en el área de visualización
- Deshacer la última acción para deshacer un cambio reciente
- Aumentar el zoom para acercar el lienzo
- Disminuir el zoom para alejar el lienzo
- Control deslizante de zoom para controlar el nivel de zoom
- Vista previa de zoom para proporcionar una vista previa del lienzo
- Expandir todo/Contraer todo para ver más o menos columnas dentro de una tabla del lienzo
- Borrar lienzo para borrar todas las tablas de la
A la izquierda, verá una lista de carpetas que contienen los elementos de la plantilla que puede agregar al lienzo. Hay varios controles que le ayudarán.
- Cuadro de búsqueda para buscar tablas basadas en un término. El término se buscará en las tablas, columnas y descripciones de la plantilla.
- Filtrar tablas para seleccionar secciones enteras del modelo que se explorarán
- Las plantillas de Enterprise seleccionan tablas de cada área de negocio para mostrar un "lo mejor de".
- Las plantillas de área de negocio seleccionan tablas principalmente de un área de negocio único, pero también incluyen tablas relacionadas de otras áreas de negocio.
- Las áreas de negocio son carpetas que contienen tablas relacionadas con esa construcción empresarial. Por ejemplo, Previsión y presupuesto contiene tablas relacionadas con la administración de presupuestos.
- Puede expandir las carpetas de área de negocio para ver las tablas y activar la casilla para agregarlas al lienzo.
- Las tablas seleccionadas se pueden quitar mediante la casilla.
- También puede hacer clic en los puntos suspensivos situados junto a la carpeta de área de negocio y en Seleccionar todo o Anular selección de todo para agregar o quitar todas las tablas de esa área de negocio en el lienzo.
Puede seleccionar una tabla del lienzo. Se abre el panel de propiedades de la tabla con las pestañas General, Columnas y Relaciones.
- La pestaña General tiene información sobre la tabla, como su nombre y descripción.
- La pestaña Columnas tiene los detalles sobre todas las columnas que la contienen, como los nombres de columna y los tipos de datos.
- En la pestaña Relaciones se enumeran las relaciones entrantes y salientes de la tabla con otras tablas del lienzo.
- Use el botón de alternancia Seleccionar todo para ver todas las relaciones "from" y "to" en esa tabla.
- Mediante las casillas situadas junto a cada relación de la pestaña de relaciones, agregue la tabla-relación necesaria en el lienzo.
Para agregar rápidamente tablas relacionadas con las tablas del lienzo, seleccione las elipses a la derecha del nombre de la tabla y, a continuación, seleccione Agregar tablas relacionadas. Todas las tablas con relaciones existentes se agregan al lienzo. Si esto agrega demasiadas tablas al lienzo, use Deshacer la última acción para deshacer este cambio.
Una vez que el lienzo tenga todas las tablas que cumplen sus requisitos, seleccione Crear base de datos para continuar con la creación de la base de datos de lago. La nueva base de datos se mostrará en el diseñador de bases de datos y podrá personalizarla según sus necesidades empresariales.
El diseñador de bases de datos tiene más Propiedades que deben configurarse en la parte derecha.
- Nombre: asigne un nombre a la base de datos. Los nombres no se pueden editar después de publicar la base de datos, por lo que debe asegurarse de que el nombre que elija sea correcto.
- Descripción: proporcionar una descripción para la base de datos es opcional, pero esto permite a los usuarios comprender el propósito de la base de datos.
- Configuración de almacenamiento de la base de datos: esta sección contiene la información de almacenamiento predeterminada para las tablas de la base de datos. Este valor predeterminado se aplica a cada tabla de la base de datos, a menos que se invalide en la propia tabla.
- Servicio vinculado: es el servicio vinculado predeterminado que se usa para almacenar los datos en Azure Data Lake Storage. Se mostrará el servicio vinculado predeterminado asociado al área de trabajo de Synapse, pero puede cambiar el servicio vinculado a cualquier cuenta de almacenamiento de ADLS que quiera.
- Carpeta de entrada: se usa para establecer la ruta de acceso predeterminada del contenedor y la carpeta de ese servicio vinculado mediante el explorador de archivos o editando manualmente la ruta de acceso con el icono de lápiz.
- Formato de datos: las bases de datos de lago en Azure Synapse Analytics son compatibles con Apache Parquet y texto delimitado como formatos de almacenamiento de los datos.
Nota
Siempre puede invalidar la configuración de almacenamiento predeterminada tabla por tabla, y el valor predeterminado seguirá siendo personalizable. Si no está seguro de qué elegir, puede volver más adelante. Si no está seguro de la jerarquía de carpetas del lago de datos, también puede especificar caracteres comodín para recorrer la estructura de directorios.
Puede empezar a personalizar las tablas, columnas y relaciones heredadas de la plantilla de base de datos. También puede agregar tablas personalizadas, columnas y relaciones según sea necesario en la base de datos. Para obtener más información sobre cómo modificar una base de datos de lago, consulte Modificar una base de datos de lago.
Ahora que tiene la base de datos personalizada, es el momento de publicarla. Si usa la integración de Git con el área de trabajo de Synapse, debe confirmar los cambios y combinarlos en la rama de colaboración. Obtenga más información sobre el control de código fuente en Azure Synapse. Si usa el modo en directo de Synapse, puede seleccionar Publicar.
La base de datos se validará para ver si hay errores antes de su publicación. Los errores encontrados se mostrarán en la pestaña de notificaciones y tendrán instrucciones sobre cómo solucionar el error.
La publicación creará el esquema de base de datos en el Metastore de Azure Synapse. Después de la publicación, los objetos de base de datos y tabla serán visibles para otros servicios de Azure y permitirán que los metadatos de la base de datos fluyan a aplicaciones como Power BI o Microsoft Purview.
Ahora ha creado una base de datos de lago mediante una plantilla de base de datos de lago en Azure Synapse.
Pasos siguientes
Siga explorando las funcionalidades del diseñador de bases de datos mediante los vínculos siguientes.