Delen via


Module 1: Een pijplijn maken met Data Factory

Deze module duurt 10 minuten, waarbij onbewerkte gegevens uit de bronopslag worden opgenomen in de Bronze-tabel van een datalakehouse met behulp van de Copy-activiteit in een pijplijn.

De stappen op hoog niveau in module 1 zijn als volgt:

  1. Maak een gegevenspijplijn.
  2. Gebruik een kopieeractiviteit in de pijplijn om voorbeeldgegevens in een data Lakehouse te laden.

Een gegevenspijplijn maken

  1. Een Microsoft Fabric-tenantaccount met een actief abonnement is vereist. Maak een gratis account.

  2. Zorg ervoor dat u een werkruimte met Microsoft Fabric hebt ingeschakeld: Een werkruimte maken.

  3. Meld u aan bij Power BI-.

  4. Selecteer het standaardpictogram van Power BI linksonder in het scherm en schakel over naar de Data Factory--ervaring.

    schermopname van de selectie van de Data Factory-ervaring.

  5. Selecteer gegevenspijplijn en geef een pijplijnnaam op. Selecteer vervolgens Maken.

    Schermopname van de startpagina van Data Factory met de knop om een nieuwe gegevenspijplijn te maken geselecteerd.

    schermopname van het dialoogvenster om de nieuwe pijplijn een naam te geven.

Een kopieeractiviteit in de pijplijn gebruiken om voorbeeldgegevens naar een data Lakehouse te laden

Stap 1: Gebruik de kopieerassistent om een kopieeractiviteit te configureren.

Selecteer Kopieer gegevensassistent om het hulpprogramma voor de kopieerassistent te openen.

Schermopname van de selectie van de activiteit Gegevens kopiëren vanaf de startpagina van de nieuwe pijplijn.

Stap 2: Configureer uw instellingen in de kopieerassistent.

  1. Het dialoogvenster Gegevens kopiëren is zichtbaar met de eerste stap, Gegevensbron kiezen, gemarkeerd. Selecteer Voorbeeldgegevens in de opties bovenaan het dialoogvenster en selecteer vervolgens NYC Taxi - Green.

    Schermopname van de selectie van de NYC Taxi - Groene gegevens in de kopieerassistent op het tabblad Gegevensbron kiezen.

  2. Het voorbeeld van de gegevensbron wordt nu weergegeven op de pagina Verbinding maken met de gegevensbron. Controleer en selecteer vervolgens Volgende.

    Schermopname van de voorbeeldgegevens voor de nyc taxi - groene voorbeeldgegevensset.

  3. Selecteer bij de stap Gegevensbestemming kiezen van de kopieerassistent, eerst Lakehouse en dan Volgende.

    Schermopname van de selectie van de Lakehouse-bestemming op het tabblad Gegevensbestemming kiezen van de kopieerassistent voor gegevens.

  4. Selecteer Nieuwe Lakehouse- maken op de configuratiepagina van de gegevensbestemming die wordt weergegeven en voer een naam in voor het nieuwe Lakehouse. Selecteer vervolgens opnieuw Volgende.

    Schermopname van de configuratiepagina voor de gegevensbestemming van de kopieerassistent, waarbij u de optie Nieuwe Lakehouse maken kiest en een Lakehouse-naam opgeeft.

  5. Configureer nu de details van uw Lakehouse-bestemming op de Selecteer en wijs deze toe aan mappad of tabel. pagina. Selecteer tabellen voor de hoofdmap, geef een tabelnaam op en kies de actie overschrijven. Vink het selectievakje Partitie inschakelen niet aan dat verschijnt nadat u de actie Overschrijven hebt geselecteerd.

    Schermopname van het tabblad Verbinding maken met gegevensbestemming van de assistent Gegevens kopiëren, in de mappad of tabelstap selecteren en toewijzen.

  6. Controleer ten slotte de configuratie op de pagina Beoordelen en opslaan van de assistent voor het kopiëren van gegevens. Schakel voor deze zelfstudie het selectievakje Start onmiddellijk de gegevensoverdracht uit, aangezien de activiteit in de volgende stap handmatig wordt uitgevoerd. Selecteer vervolgens OK-.

    Schermopname van de Gegevens kopiëren-assistent op de Controleren en opslaan-pagina.

Stap 3: Voer de resultaten van uw kopieeractiviteit uit en bekijk deze.

  1. Selecteer het tabblad Uitvoeren in de pipeline-editor. Selecteer vervolgens de knop uitvoeren en Opslaan en uitvoeren bij de prompt om de kopieeractiviteit uit te voeren.

    Schermafbeelding van het tabblad 'Pijplijn uitvoeren' met de knop 'Uitvoeren' gemarkeerd.

    Schermopname van het dialoogvenster Opslaan en uitvoeren met de knop Opslaan en uitvoeren gemarkeerd.

  2. U kunt de uitvoering volgen en de resultaten bekijken op het tabblad Uitvoer onder het pijplijncanvas. Selecteer de knop 'uitvoeringsdetails' (het brilpictogram dat verschijnt wanneer u met de muis boven de lopende pijplijn houdt) om de details van de uitvoering weer te geven.

    Schermopname met de knop Uitvoeringsdetails op het tabblad Pijplijnuitvoer.

  3. De details van de uitvoering tonen dat 1.508.501 rijen zijn gelezen en geschreven.

    Schermopname van de gegevensgegevens kopiëren voor de pijplijnuitvoering.

  4. Vouw de uitsplitsing van het gedeelte Duur uit om de duur van elke fase van de kopieeractiviteit te bekijken. Nadat u de kopieergegevens hebt bekeken, selecteer Sluiten.

    Schermopname van de uitsplitsing van de duur van de uitvoering van de kopieeractiviteit.

In deze eerste module voor onze end-to-end-zelfstudie voor uw eerste gegevensintegratie met behulp van Data Factory in Microsoft Fabric hebt u geleerd hoe u het volgende kunt doen:

  • Maak een gegevenspijplijn.
  • Voeg een kopieeractiviteit toe aan uw pijplijn.
  • Gebruik voorbeeldgegevens en maak een data Lakehouse om de gegevens op te slaan in een nieuwe tabel.
  • Voer de pijplijn uit en bekijk de details en de duur van de desbetreffende onderdelen.

Ga nu door naar de volgende sectie om uw gegevensstroom te maken.