Delen via


Zelfstudie: Gegevens analyseren met een notebook

Van toepassing op:✅ SQL Analytics-eindpunt en -magazijn in Microsoft Fabric

In deze zelfstudie leert u hoe u gegevens kunt analyseren met behulp van T-SQL-notebook of een notebook met een Snelkoppeling naar Lakehouse.

Optie 1: Een T-SQL-notebook maken in het magazijn

Maak een T-SQL-notebook op een van de volgende twee manieren om aan de slag te gaan:

  1. Maak een T-SQL-notebook op de startpagina van Microsoft Fabric Warehouse. Navigeer naar de datawarehouse-workload en kies Notebook.

  2. Selecteer + Warehouses en voeg het WideWorldImporters magazijn toe. Selecteer het magazijn in het WideWorldImporters dialoogvenster OneLake.

    Schermopname van de fabric-portal van de knop Magazijnen toevoegen onder Magazijnen in het gebied Alle bronnen van de Explorer.

  3. Maak een T-SQL-notebook vanuit de magazijneditor. Selecteer in uw WideWorldImporters magazijn op het bovenste navigatielint nieuwe SQL-query en vervolgens Nieuwe SQL-query in notebook.

    Schermopname van de Fabric-portal van de nieuwe SQL-query in de menuoptie Notebook.

  4. Zodra het notebook is gemaakt, kunt u zien dat WideWorldImporters het magazijn in de verkenner is geladen en wordt op het lint T-SQL weergegeven als de standaardtaal.

  5. Klik met de rechtermuisknop om de menuoptie Meer in de dimension_city tabel te openen. Selecteer SELECT TOP 100 om een snelle SQL-sjabloon te genereren om 100 rijen uit de tabel te verkennen.

    Schermopname van de Fabric-portal van de optie SELECT TOP 100 rijen.

  6. Voer de codecel uit en u kunt berichten en resultaten zien.

    Schermopname van de Fabric-portal van de RESULTATEN SELECT TOP 100.

Optie 2: Een lakehouse-snelkoppeling maken en gegevens analyseren met een notebook

Eerst maken we een nieuw lakehouse. Ga als volgt te werk om een nieuw lakehouse te maken in uw Microsoft Fabric-werkruimte:

  1. Selecteer de Data Warehouse Tutorial werkruimte in het navigatiemenu.

  2. Selecteer + New>Lakehouse.

    Schermopname van de Fabric-portal met het menu + Nieuw. Lakehouse wordt in rood geboksd.

  3. Voer in het veld Naam het veld Naam in ShortcutExerciseen selecteer Maken.

  4. Het nieuwe lakehouse wordt geladen en de verkennerweergave wordt geopend, met het menu Gegevens ophalen in uw lakehouse-menu . Selecteer onder Gegevens laden in uw lakehouse de knop Nieuwe snelkoppeling .

    Schermopname van de Fabric-portal met het menu Gegevens laden in uw Lakehouse-menu op de landingspagina. De knop Nieuwe snelkoppeling wordt rood weergegeven.

  5. Selecteer in het venster Nieuwe snelkoppeling de knop voor Microsoft OneLake.

    Schermopname van de Fabric-portal met het venster Nieuwe snelkoppeling. De knop voor Microsoft OneLake wordt rood weergegeven.

  6. Blader in het venster Selecteer een gegevensbrontype door de lijst totdat u het magazijn hebt gevonden met de naam WideWorldImporters die u eerder hebt gemaakt. Selecteer deze en selecteer vervolgens Volgende.

  7. Vouw tabellen uit in de browser van het OneLake-object, vouw het dbo schema uit en schakel vervolgens het selectievakje voor dimension_customer. Selecteer Next. Selecteer Maken.

  8. Als u een map Unidentified onder Tabellen ziet, selecteert u het pictogram Vernieuwen in de horizontale menubalk.

    Schermopname van de Fabric-portal met de knop Vernieuwen op de horizontale menubalk en de niet-geïdentificeerde tabellen onder ShortcutExercise in de Lakehouse-verkenner.

  9. Selecteer de dimension_customer tabel in de lijst om een voorbeeld van de gegevens te bekijken. Het lakehouse toont de gegevens uit de dimension_customer tabel uit het magazijn!

    Schermopname van de Fabric-portal met de gegevensvoorbeeld van de dimension_customer tabel.

  10. Maak vervolgens een nieuw notitieblok om een query uit te voeren op de dimension_customer tabel. Selecteer op het lint Start de vervolgkeuzelijst voor Notitieblok openen en kies Nieuw notitieblok.

  11. Selecteer in Explorer de bronmap Lakehouses.

  12. Selecteer en sleep de dimension_customer tabel uit de lijst Tabellen naar de geopende notebookcel. U kunt zien dat er een PySpark-query is geschreven om alle gegevens uit te voeren ShortcutExercise.dimension_customer. Deze notebookervaring is vergelijkbaar met de Ervaring van Visual Studio Code Jupyter Notebook. U kunt het notebook ook openen in VS Code.

    Schermopname van de notitieblokweergave van de Fabric-portal. Een pijl geeft het pad aan om dimension_customer te selecteren en sleep deze vervolgens naar de geopende notebookcel.

  13. Selecteer op het lint Start de knop Alles uitvoeren. Zodra de query is voltooid, ziet u dat u PySpark eenvoudig kunt gebruiken om query's uit te voeren op de magazijntabellen.

    Schermopname van de Fabric-portal met de resultaten van het uitvoeren van het notebook om gegevens uit dimension_customer weer te geven.

Volgende stap