Delen via


Kopiëren van Azure Blob Storage naar Lakehouse

In deze zelfstudie bouwt u een gegevenspijplijn om een CSV-bestand te verplaatsen van een invoermap van een Azure Blob Storage-bron naar een Lakehouse-bestemming.

Vereisten

Om aan de slag te gaan, moet u aan de volgende vereisten voldoen:

  • Zorg ervoor dat u een Werkruimte met Microsoft Fabric hebt ingeschakeld: Maak een werkruimte.

  • Selecteer de knop Nu uitproberen! om de Azure Blob Storage-gegevensbron van de kopie voor te bereiden. Maak een nieuwe resourcegroep voor deze Azure Blob Storage en selecteer Beoordelen en maken>.

    Schermopname van het scherm Projectdetails.

    Vervolgens wordt een Azure Blob Storage gemaakt en moviesDB2.csv geüpload naar de invoermap van de gemaakte Azure Blob Storage.

    Schermopname waarin wordt weergegeven waar nieuwe opslag wordt weergegeven in de map.

Een gegevenspijplijn maken

  1. Schakel over naar Data factory op de pagina app.powerbi.com.

  2. Maak een nieuwe werkruimte voor deze demo.

    Schermopname van het scherm Werkruimte.

  3. Selecteer Nieuw en selecteer vervolgens Gegevenspijplijn.

    Schermopname van het menu Nieuw.

Gegevens kopiëren met de kopieerassistent

In deze sessie begint u met het bouwen van een gegevenspijplijn met behulp van de volgende stappen. Met deze stappen kopieert u een CSV-bestand uit een invoermap van een Azure Blob Storage naar een Lakehouse-bestemming met behulp van de kopieerassistent.

Stap 1: Beginnen met de kopieerassistent

  1. Selecteer Gegevensassistent kopiëren op het canvas om het hulpprogramma voor de kopieerassistent te openen om aan de slag te gaan. Of selecteer Kopieerassistent gebruiken in de vervolgkeuzelijst Gegevens kopiëren onder het tabblad Activiteiten op het lint.

    Schermopname van twee opties om de kopieerassistent te selecteren.

Stap 2: Uw bron configureren

  1. Typ blob in het selectiefilter, selecteer vervolgens Azure Blobs en selecteer Volgende.

    Schermopname die laat zien waar u Azure Blob Storage als gegevensbron kunt kiezen.

  2. Geef uw accountnaam of URL op en maak een verbinding met uw gegevensbron door in de vervolgkeuzelijst Verbinding maken een nieuwe verbinding te selecteren.

    Schermopname die laat zien waar u Nieuwe verbinding moet selecteren.

    1. Nadat u Een nieuwe verbinding met uw opslagaccount hebt geselecteerd, hoeft u alleen het verificatietype in te vullen. In deze demo kiezen we Accountsleutel , maar u kunt een ander verificatietype kiezen, afhankelijk van uw voorkeur.

      Schermopname van het scherm Verbinding maken met gegevensbron van de gegevensassistent kopiëren.

    2. Zodra de verbinding is gemaakt, hoeft u alleen Next to Connect to data source te selecteren.

  3. Kies het bestand moviesDB2.csv in de bronconfiguratie om een voorbeeld te bekijken en selecteer vervolgens Volgende.

    Schermopname die laat zien hoe u een gegevensbron kiest.

Stap 3: Uw bestemming configureren

  1. Selecteer Lakehouse.

    Schermopname van het dialoogvenster Gegevensbestemming kiezen met Lakehouse geselecteerd.

  2. Geef een naam op voor het nieuwe Lakehouse. Selecteer vervolgens Maken en verbinding maken.

    Schermopname van het dialoogvenster Gegevensbestemming kiezen met de optie New Lakehouse geselecteerd.

  3. Configureer en wijs uw brongegevens toe aan uw bestemming; selecteer vervolgens Volgende om de doelconfiguraties te voltooien.

    Schermopname van het dialoogvenster Verbinding maken met gegevensbestemming in de kopieergegevensassistent met de tabelnaam MoviesDB ingevuld.

Stap 4: Uw kopieeractiviteit controleren en maken

  1. Controleer de instellingen voor de kopieeractiviteit in de vorige stappen en selecteer Opslaan en uitvoeren om te voltooien. U kunt ook teruggaan naar de vorige stappen om uw instellingen zo nodig in het hulpprogramma te bewerken.

    Schermopname van het scherm Controleren en maken in het dialoogvenster Gegevensassistent kopiëren.

  2. Zodra de kopieeractiviteit is voltooid, wordt de kopieeractiviteit toegevoegd aan uw gegevenspijplijncanvas en direct uitgevoerd als u het selectievakje Gegevensoverdracht starten direct hebt ingeschakeld.

    Schermopname van de voltooide Copy-activiteit.

Uw gegevenspijplijn uitvoeren en plannen

  1. Als u het selectievakje Gegevensoverdracht starten niet direct hebt ingeschakeld op de pagina Controleren en maken , gaat u naar het tabblad Start en selecteert u Uitvoeren. Selecteer Vervolgens Opslaan en Uitvoeren.

    Schermopname van de knop Uitvoeren van de Copy-activiteit op het tabblad Start.

    Schermopname van het dialoogvenster Opslaan en uitvoeren voor de Copy-activiteit.

  2. Selecteer op het tabblad Uitvoer de koppeling met de naam van uw Copy-activiteit om de voortgang te controleren en de resultaten van de uitvoering te controleren.

    Schermopname van de knop Details uitvoeren.

  3. In het dialoogvenster Gegevens kopiëren worden de resultaten van de uitvoering weergegeven, inclusief de status, het volume met gelezen en geschreven gegevens, begin- en eindtijden en duur.

    Schermopname van het dialoogvenster Gegevens kopiëren.

  4. U kunt ook plannen dat de pijplijn wordt uitgevoerd met een specifieke frequentie, indien nodig. In het volgende voorbeeld ziet u hoe u de pijplijn elke 15 minuten plant.

    Schermopname van het dialoogvenster Planningsconfiguratie.

    Schermopname van een pijplijn met een geconfigureerd schema dat elke 15 minuten moet worden uitgevoerd.

De pijplijn in dit voorbeeld laat zien hoe u gegevens kopieert van Azure Blob Storage naar Lakehouse. U hebt geleerd hoe u:

  • Maak een gegevenspijplijn.
  • Gegevens kopiëren met de Copy Assistant.
  • Voer uw gegevenspijplijn uit en plan deze.

Ga vervolgens verder voor meer informatie over het bewaken van uw pijplijnuitvoeringen.