Delen via


Lakehouse-zelfstudie: Een lakehouse maken, voorbeeldgegevens opnemen en een rapport maken

In deze zelfstudie bouwt u een lakehouse, neemt u voorbeeldgegevens op in de Delta-tabel, past u waar nodig transformatie toe en maakt u vervolgens rapporten. In deze zelfstudie komen de volgende onderwerpen aan bod:

  • Een lakehouse maken op basis van de workload Data-engineer
  • Voorbeeldgegevens van klanten downloaden en opnemen
  • Tabellen toevoegen aan het semantische model
  • Een rapport maken

Als u geen Microsoft Fabric hebt, meldt u zich aan voor een gratis proefcapaciteit.

Vereisten

Een lakehouse maken

In deze sectie maakt u een lakehouse op basis van de Data-engineer ervaring.

  1. Selecteer werkruimten in het menu aan de linkerkant in Power BI.

  2. Als u uw werkruimte wilt openen, voert u de naam in het zoektekstvak bovenaan in en selecteert u deze in de zoekresultaten.

  3. Selecteer Data-engineer ing in de schakeloptie linksonder.

    Schermopname die laat zien waar u de switcher en Data-engineer ing selecteert.

  4. Selecteer Lakehouse in het Data-engineer scherm om een lakehouse te maken.

  5. Voer in het dialoogvenster New lakehouse wwilakehouse in het veld Naam in.

    Schermopname van het dialoogvenster New lakehouse.

  6. Selecteer Maken om het nieuwe lakehouse te maken en te openen.

Voorbeeldgegevens opnemen

In deze sectie neemt u voorbeeldgegevens van klanten op in lakehouse.

Notitie

Als u OneDrive niet hebt geconfigureerd, meldt u zich aan voor de gratis proefversie van Microsoft 365: gratis proefversie - Probeer Microsoft 365 een maand.

  1. Download het dimension_customer.csv-bestand uit de opslagplaats Fabric-voorbeelden.

  2. Op het tabblad Start , onder Gegevens ophalen in uw lakehouse, ziet u opties voor het laden van gegevens in lakehouse. Selecteer Nieuwe gegevensstroom Gen2.

    Schermopname die laat zien waar u de optie New Dataflow Gen2 selecteert om gegevens in uw Lakehouse te laden.

  3. Selecteer Importeren in een tekstbestand/CSV-bestand in het scherm nieuwe gegevensstroom.

  4. Selecteer in het scherm Verbinding maken met gegevensbron het keuzerondje Bestand uploaden. Sleep het dimension_customer.csv bestand dat u in stap 1 hebt gedownload en zet het neer. Nadat het bestand is geĆ¼pload, selecteert u Volgende.

    Schermopname die laat zien waar het bestand uploaden moet worden geselecteerd en waar het eerder gedownloade bestand moet worden gesleept.

  5. Bekijk op de pagina Voorbeeldbestandsgegevens een voorbeeld van de gegevens en selecteer Maken om door te gaan en terug te keren naar het gegevensstroomcanvas.

  6. Werk in het deelvenster Query-instellingen het veld Naam bij naar dimension_customer.

    Notitie

    Fabric voegt standaard een spatie en nummer toe aan het einde van de tabelnaam. Tabelnamen moeten kleine letters bevatten en mogen geen spaties bevatten. Wijzig de naam en verwijder eventuele spaties uit de tabelnaam.

    Schermopname van het deelvenster Query-instellingen, waarin wordt weergegeven waar u de naam moet invoeren en de gegevensbestemming selecteert.

  7. In deze zelfstudie hebt u de klantgegevens gekoppeld aan een lakehouse. Als u andere gegevensitems hebt die u aan het lakehouse wilt koppelen, kunt u deze toevoegen:

    1. Selecteer gegevensbestemming toevoegen in de menu-items en selecteer Lakehouse. Meld u indien nodig aan bij uw account in het scherm Verbinding maken met gegevensbestemming en selecteer Volgende.

    2. Navigeer naar het wwilakehouse in uw werkruimte.

    3. Als de dimension_customer tabel niet bestaat, selecteert u de instelling Nieuwe tabel en voert u de tabelnaam in dimension_customer. Als de tabel al bestaat, selecteert u de bestaande tabelinstelling en kiest u dimension_customer in de lijst met tabellen in de objectverkenner. Selecteer Volgende.

      Schermopname die laat zien hoe u de doeltabel kiest.

    4. Selecteer in het deelvenster Doelinstellingen kiezen de methode Vervangen als Bijwerken. Selecteer Instellingen opslaan om terug te keren naar het gegevensstroomcanvas.

  8. Vanuit het gegevensstroomcanvas kunt u de gegevens eenvoudig transformeren op basis van uw zakelijke vereisten. Ter vereenvoudiging brengen we geen wijzigingen aan in deze zelfstudie. Als u wilt doorgaan, selecteert u Publiceren rechtsonder in het scherm.

    Schermopname van het deelvenster Query-instelling met de knop Publiceren.

  9. Een draaiende cirkel naast de naam van de gegevensstroom geeft aan dat de publicatie wordt uitgevoerd in de itemweergave. Wanneer het publiceren is voltooid, selecteert u de ... en selecteert u Eigenschappen. Wijzig de naam van de gegevensstroom in Load Lakehouse Table en selecteer Opslaan.

  10. Selecteer de optie Nu vernieuwen naast de naam van de gegevensstroom om de gegevensstroom te vernieuwen. Met deze optie wordt de gegevensstroom uitgevoerd en worden gegevens van het bronbestand naar de lakehouse-tabel verplaatst. Terwijl deze wordt uitgevoerd, ziet u een draaiende cirkel onder de kolom Vernieuwd in de itemweergave.

    Schermopname die laat zien waar u het pictogram Nu vernieuwen kunt vinden.

  11. Zodra de gegevensstroom is vernieuwd, selecteert u uw nieuwe lakehouse in de linkernavigatiebalk om de dimension_customer Delta-tabel weer te geven.

    Schermopname van het navigatiedeelvenster van waaruit het lakehouse wordt geopend.

  12. Selecteer de tabel om een voorbeeld van de gegevens te bekijken. U kunt ook het SQL-analyse-eindpunt van het lakehouse gebruiken om een query uit te voeren op de gegevens met SQL-instructies. Selecteer het SQL Analytics-eindpunt in de vervolgkeuzelijst Lakehouse in de rechterbovenhoek van het scherm.

    Schermopname van de Delta-tabel, waarin wordt weergegeven waar u sql-analyse-eindpunt kunt selecteren.

  13. Selecteer de dimension_customer tabel om een voorbeeld van de gegevens te bekijken of selecteer Nieuwe SQL-query om uw SQL-instructies te schrijven.

    Schermopname van het scherm sql-analyse-eindpunt, waarin wordt weergegeven waar u nieuwe SQL-query kunt selecteren.

  14. Met de volgende voorbeeldquery wordt het aantal rijen samengevoegd op basis van de kolom BuyingGroup van de tabel dimension_customer . SQL-querybestanden worden automatisch opgeslagen voor toekomstige naslaginformatie en u kunt deze bestanden wijzigen of verwijderen op basis van uw behoeften.

    Als u het script wilt uitvoeren, selecteert u het pictogram Uitvoeren boven aan het scriptbestand.

    SELECT BuyingGroup, Count(*) AS Total
    FROM dimension_customer
    GROUP BY BuyingGroup
    

Een rapport maken

In deze sectie bouwt u een rapport op basis van de opgenomen gegevens.

  1. Voorheen werden alle lakehouse-tabellen en -weergaven automatisch toegevoegd aan het semantische model. Met recente updates moet u voor nieuwe lakehouses handmatig uw tabellen toevoegen aan het semantische model. Open uw lakehouse en ga naar de eindpuntweergave van SQL Analytics. Selecteer op het tabblad Rapportage de optie Standaard semantisch model beheren en selecteer de tabellen die u wilt toevoegen aan het semantische model. Selecteer in dit geval de dimension_customer tabel.

    Schermopname waarin u de tabellen kunt selecteren die u wilt toevoegen aan het semantische model.

  2. Als u ervoor wilt zorgen dat de tabellen in het semantische model altijd gesynchroniseerd zijn, schakelt u over naar de eindpuntweergave van SQL Analytics en opent u het deelvenster Met lakehouse-instellingen. Selecteer het semantische standaardmodel van Power BI en schakel het standaard semantische Power BI-model synchroniseren in. Zie Standaard semantische Power BI-modellen voor meer informatie.

    Schermopname van het inschakelen van gegevenssynchronisatie met het standaard semantische model.

  3. Nadat de tabel is toegevoegd, maakt Fabric een semantisch model met dezelfde naam als het lakehouse.

    Schermopname van het standaard semantische model dat is gemaakt toen het nieuwe lakehouse werd gemaakt.

  4. Vanuit het deelvenster semantisch model kunt u alle tabellen bekijken. U hebt opties om volledig nieuwe rapporten te maken, gepagineerde rapporten of power BI automatisch een rapport te laten maken op basis van uw gegevens. Voor deze zelfstudie selecteert u onder Deze gegevens verkennen de optie Automatisch een rapport maken. In de volgende zelfstudie maken we een volledig nieuw rapport.

    Schermopname van de pagina met details van het semantische model, waarin wordt weergegeven waar u een rapport kunt maken.

  5. Omdat de tabel een dimensie is en er geen metingen in staan, maakt Power BI een meting voor het aantal rijen en voegt deze samen in verschillende kolommen en maakt u verschillende grafieken, zoals wordt weergegeven in de volgende afbeelding. U kunt dit rapport voor de toekomst opslaan door Opslaan te selecteren op het bovenste lint. U kunt meer wijzigingen aanbrengen in dit rapport om aan uw vereisten te voldoen door andere tabellen of kolommen op te slaan of uit te sluiten.

    Schermopname van een pagina Snelle samenvatting met vier verschillende staafdiagrammen.

Volgende stap