Zelfstudie: Gegevens analyseren met een notebook
Van toepassing op:✅ SQL Analytics-eindpunt en -magazijn in Microsoft Fabric
In deze zelfstudie leert u hoe u gegevens kunt analyseren met behulp van T-SQL-notebook of een notebook met een Snelkoppeling naar Lakehouse.
Optie 1: Een T-SQL-notebook maken in het magazijn
Maak een T-SQL-notebook op een van de volgende twee manieren om aan de slag te gaan:
Maak een T-SQL-notebook op de startpagina van Microsoft Fabric Warehouse. Navigeer naar de datawarehouse-workload en kies Notebook.
Selecteer + Warehouses en voeg het
WideWorldImporters
magazijn toe. Selecteer het magazijn in hetWideWorldImporters
dialoogvenster OneLake.Maak een T-SQL-notebook vanuit de magazijneditor. Selecteer in uw
WideWorldImporters
magazijn op het bovenste navigatielint nieuwe SQL-query en vervolgens Nieuwe SQL-query in notebook.Zodra het notebook is gemaakt, kunt u zien dat
WideWorldImporters
het magazijn in de verkenner is geladen en wordt op het lint T-SQL weergegeven als de standaardtaal.Klik met de rechtermuisknop om de menuoptie Meer in de
dimension_city
tabel te openen. Selecteer SELECT TOP 100 om een snelle SQL-sjabloon te genereren om 100 rijen uit de tabel te verkennen.Voer de codecel uit en u kunt berichten en resultaten zien.
Optie 2: Een lakehouse-snelkoppeling maken en gegevens analyseren met een notebook
Eerst maken we een nieuw lakehouse. Ga als volgt te werk om een nieuw lakehouse te maken in uw Microsoft Fabric-werkruimte:
Selecteer de
Data Warehouse Tutorial
werkruimte in het navigatiemenu.Selecteer + New>Lakehouse.
Voer in het veld Naam het veld Naam in
ShortcutExercise
en selecteer Maken.Het nieuwe lakehouse wordt geladen en de verkennerweergave wordt geopend, met het menu Gegevens ophalen in uw lakehouse-menu . Selecteer onder Gegevens laden in uw lakehouse de knop Nieuwe snelkoppeling .
Selecteer in het venster Nieuwe snelkoppeling de knop voor Microsoft OneLake.
Blader in het venster Selecteer een gegevensbrontype door de lijst totdat u het magazijn hebt gevonden met de naam
WideWorldImporters
die u eerder hebt gemaakt. Selecteer deze en selecteer vervolgens Volgende.Vouw tabellen uit in de browser van het OneLake-object, vouw het
dbo
schema uit en schakel vervolgens het selectievakje voordimension_customer
. Selecteer Next. Selecteer Maken.Als u een map
Unidentified
onder Tabellen ziet, selecteert u het pictogram Vernieuwen in de horizontale menubalk.Selecteer de
dimension_customer
tabel in de lijst om een voorbeeld van de gegevens te bekijken. Het lakehouse toont de gegevens uit dedimension_customer
tabel uit het magazijn!Maak vervolgens een nieuw notitieblok om een query uit te voeren op de
dimension_customer
tabel. Selecteer op het lint Start de vervolgkeuzelijst voor Notitieblok openen en kies Nieuw notitieblok.Selecteer in Explorer de bronmap Lakehouses.
Selecteer en sleep de
dimension_customer
tabel uit de lijst Tabellen naar de geopende notebookcel. U kunt zien dat er een PySpark-query is geschreven om alle gegevens uit te voerenShortcutExercise.dimension_customer
. Deze notebookervaring is vergelijkbaar met de Ervaring van Visual Studio Code Jupyter Notebook. U kunt het notebook ook openen in VS Code.Selecteer op het lint Start de knop Alles uitvoeren. Zodra de query is voltooid, ziet u dat u PySpark eenvoudig kunt gebruiken om query's uit te voeren op de magazijntabellen.