Compartir a través de


Tutorial: Analizar datos con un cuaderno

Se aplica a:✅ punto de conexión de análisis de SQL y Warehouse en Microsoft Fabric

En este tutorial, obtendrá información sobre cómo puede usar el análisis de datos mediante un cuaderno de T-SQL o mediante un cuaderno con un acceso directo de Lakehouse.

Opción 1: Creación de un cuaderno de T-SQL en el almacenamiento

Para empezar, cree un cuaderno de T-SQL de una de las dos maneras siguientes:

  1. Cree un cuaderno de T-SQL desde la página principal de Microsoft Fabric Warehouse. Vaya a la carga de trabajo de Almacenamiento de datos y elija Cuaderno.

  2. Seleccione + Almacenes y agregue el almacén WideWorldImporters. Seleccione el almacén WideWorldImporters en el cuadro de diálogoOneLake.

    Recorte de pantalla del portal de Fabric del botón Agregar almacenes debajo de Almacenes en el área Todos los orígenes del Explorador.

  3. Cree un cuaderno de T-SQL desde el editor de almacenamiento. Desde el almacén WideWorldImporters, en la cinta de navegación superior, seleccione Nueva consulta SQL y, después, Nueva consulta SQL en el cuaderno.

    Recorte de pantalla del portal de Fabric del botón Nueva consulta SQL en la opción de menú Cuaderno.

  4. Una vez que se creer el cuaderno, puede ver que el almacenamiento WideWorldImporters se carga en el explorador y que en la cinta se muestra T-SQL como lenguaje predeterminado.

  5. Haga clic con el botón derecho para iniciar la opción de menú Más en la tabla dimension_city. Seleccione SELECT TOP 100 a fin de generar una plantilla SQL rápida para explorar 100 filas de la tabla.

    Recorte de pantalla del portal de Fabric con la opción Seleccionar las primeras 100 filas.

  6. Ejecute la celda de código para ver mensajes y resultados.

    Recorte de pantalla del portal de Fabric de los resultados de Seleccionar las primeras 100 filas.

Opción 2: Creación de un acceso directo de almacén de lago de datos y análisis de datos con un cuaderno

En primer lugar, creamos un nuevo lago de datos. Para crear un nuevo lago de datos en el área de trabajo de Microsoft Fabric:

  1. Seleccione el área de trabajo Data Warehouse Tutorial en el menú de navegación.

  2. Selecciona + Nuevo>Almacén de lago.

    Captura de pantalla del portal de Fabric que muestra el menú + Nuevo. Almacén de lago aparece en un recuadro rojo.

  3. En el campo Nombre, introduce ShortcutExercise y selecciona Crear.

  4. El nuevo lago de datos se carga y se abre la vista Explorador, con el menú Obtener datos en el lago de datos. En Cargar datos en el lago de datos, seleccione el botón Nuevo acceso directo.

    Captura de pantalla del portal de Fabric en la que se muestra el menú Cargar datos en el lago de datos de la página de aterrizaje. El botón Nuevo acceso directo aparece en un recuadro rojo.

  5. En la ventana Nuevo acceso directo, seleccione el botón Microsoft OneLake.

    Captura de pantalla del portal de Fabric que muestra la ventana Nuevo acceso directo. El botón Microsoft OneLake aparece en un recuadro rojo.

  6. En la ventana Seleccionar un tipo de origen de datos, desplácese por la lista hasta que encuentre el almacenamiento denominado WideWorldImporters que creó anteriormente. Selecciónelo y, a continuación, elija Siguiente.

  7. En el examinador de objetos de OneLake, expanda Tablas, expanda el esquema dbo y, luego, seleccione la casilla para dimension_customer. Seleccione Siguiente. Seleccione Crear.

  8. Si ve una carpeta denominada Unidentified en Tablas, seleccione el icono Actualizar en la barra de menús horizontal.

    Captura de pantalla del portal de Fabric que muestra el botón Actualizar en la barra de menú horizontal y las tablas no identificadas en ShortcutExercise en el explorador del almacén de lago.

  9. Seleccione en dimension_customer la lista Tabla para obtener una vista previa de los datos. Observa que el almacén de lago muestra los datos de la tabla dimension_customer del almacenamiento.

    Captura de pantalla del portal de Fabric que muestra la vista previa de los datos de la tabla dimension_customer.

  10. A continuación, cree un cuaderno para consultar la tabla dimension_customer. En la cinta Inicio, seleccione la lista desplegable Abrir cuaderno y elija Nuevo cuaderno.

  11. En el Explorador, seleccione la carpeta de origen Lakehouses.

  12. Seleccione y arrastre dimension_customer desde la lista Tablas a la celda del cuaderno abierto. Puede ver que se ha escrito una consulta de PySpark para consultar todos los datos de ShortcutExercise.dimension_customer. Esta experiencia de cuaderno es similar a la experiencia de cuaderno de Jupyter de Visual Studio Code. También puede abrir el cuaderno en VS Code.

    Captura de pantalla de la vista de cuaderno del portal de Fabric. Una flecha indica la ruta para seleccionar dimension_customer y, a continuación, arrastre y suelte en la celda abierta del cuaderno.

  13. En la cinta de opciones Inicio, seleccione el botón Ejecutar todo. Una vez completada la consulta, verá que puede usar fácilmente PySpark para consultar las tablas de almacenamiento.

    Captura de pantalla del portal de Fabric que muestra los resultados de ejecutar el cuaderno para mostrar los datos de dimension_customer.

Paso siguiente