Lakehouse-zelfstudie: Gegevens opnemen in lakehouse
In deze zelfstudie neemt u meer dimensionale en feitentabellen van de WWI (Wide World Importers) op in het lakehouse.
Vereisten
- Als u geen lakehouse hebt, moet u een lakehouse maken.
Gegevens opnemen
In deze sectie gebruikt u de kopieergegevensactiviteit van de Data Factory-pijplijn om voorbeeldgegevens van een Azure-opslagaccount op te nemen in de sectie Bestanden van het lakehouse dat u eerder hebt gemaakt.
Selecteer Werkruimten in het linkernavigatiedeelvenster en selecteer vervolgens uw nieuwe werkruimte in het menu Werkruimten . De itemsweergave van uw werkruimte wordt weergegeven.
Selecteer gegevenspijplijn in het menu-item +Nieuw op het lint van de werkruimte.
Geef in het dialoogvenster Nieuwe pijplijn de naam op als IngestDataFromSourceToLakehouse en selecteer Maken. Er wordt een nieuwe data factory-pijplijn gemaakt en geopend.
Stel vervolgens een HTTP-verbinding in om de voorbeeldgegevens van World Wide Importers te importeren in Lakehouse. Selecteer meer weergeven in de lijst met nieuwe bronnen, zoek naar Http en selecteer deze.
Voer in het venster Verbinding maken met gegevensbron de details in de onderstaande tabel in en selecteer Volgende.
Eigenschappen Weergegeven als URL https://assetsprod.microsoft.com/en-us/wwi-sample-dataset.zip
Connection Een nieuwe verbinding maken Verbindingsnaam wwisampledata Gegevensgateway Geen Soort verificatie Anoniem Schakel in de volgende stap de binaire kopie in en kies ZipDeflate (.zip) als het compressietype omdat de bron een .zip bestand is. Houd de andere velden op de standaardwaarden en klik op Volgende.
Geef in het venster Verbinding maken met gegevensbestemming de hoofdmap op als Bestanden en klik op Volgende. Hiermee worden de gegevens naar de sectie Bestanden van het lakehouse geschreven.
Kies de bestandsindeling als Binair voor de bestemming. Klik op Volgende en vervolgens op Save+Run. U kunt pijplijnen plannen om gegevens periodiek te vernieuwen. In deze zelfstudie voeren we de pijplijn slechts één keer uit. Het kopiëren van gegevens duurt ongeveer 10-15 minuten.
U kunt de uitvoering en activiteit van de pijplijn controleren op het tabblad Uitvoer . U kunt ook gedetailleerde gegevensoverdrachtgegevens bekijken door het brilpictogram naast de naam van de pijplijn te selecteren. Deze wordt weergegeven wanneer u de muisaanwijzer over de naam beweegt.
Nadat de pijplijn is uitgevoerd, gaat u naar uw lakehouse (wwilakehouse) en opent u de verkenner om de geïmporteerde gegevens te bekijken.
Controleer of de map WideWorldImportersDW aanwezig is in de verkenner-weergave en gegevens bevat voor alle tabellen.
De gegevens worden gemaakt onder de sectie Bestanden van de Lakehouse Explorer. Een nieuwe map met GUID bevat alle benodigde gegevens. Wijzig de naam van de GUID in wwi-raw-data
Als u incrementele gegevens in een lakehouse wilt laden, raadpleegt u Incrementeel gegevens uit een datawarehouse laden naar een lakehouse.