Sdílet prostřednictvím


Kurz: Ingestování dat do skladu

Platí pro:✅ Warehouse v Microsoft Fabric

V tomto kurzu se naučíte ingestovat data z Microsoft Azure Storage do skladu a vytvářet tabulky.

Poznámka

Tento návod je součástí kompletního scénáře. Abyste mohli absolvovat tento kurz, musíte nejprve dokončit tyto kurzy:

  1. Vytvoření pracovního prostoru
  2. Vytvořte sklad

Ingestace dat

V této úloze se dozvíte, jak ingestovat data do skladu a vytvářet tabulky.

  1. Ujistěte se, že je otevřený pracovní prostor, který jste vytvořili v prvním kurzu .

  2. V úvodním podokně pracovního prostoru vyberte + Nová položka, aby se zobrazil úplný seznam dostupných typů položek.

  3. V seznamu v části Načíst data vyberte typ položky Datový kanál.

  4. V okně Nový kanál zadejte do pole NázevLoad Customer Data.

    Snímek obrazovky dialogového okna Nová pipeline se zvýrazněným zadaným názvem.

  5. Pokud chcete kanál zřídit, vyberte Vytvořit. Zřizování se dokončí, když se zobrazí úvodní stránka Vytvoření datové trasy.

  6. Na cílové stránce datového kanálu vyberteaktivity kanálu .

    snímek obrazovky s cílovou stránkou Sestavení datového kanálu a zvýrazněnou možností Aktivita kanálu

  7. V nabídce vyberte v části Přesunout a transformovat možnost Kopírovat data.

    Snímek obrazovky s oddílem Přesunout a transformovat, ukazující, kde vybrat Kopírovat data.

  8. Na pracovní ploše návrhu pipeline vyberte aktivitu Kopírování dat.

    Snímek obrazovky s kopírovanými daty umístěnými na návrhovém plátně

  9. Chcete-li nastavit aktivitu, na stránce Obecné nahraďte v poli Název výchozí text CD Load dimension_customer.

    Snímek obrazovky s kartou Obecné, kde se má zadat název aktivity kopírování

  10. Na stránce Zdroj v rozevíracím seznamu Připojení vyberte Další, abyste zobrazili všechny zdroje dat, ze kterých si můžete vybrat, včetně zdrojů dat v katalogu OneLake .

  11. Vyberte + Nový a vytvořte nový zdroj dat.

  12. Vyhledejte a pak vyberte Azure Blobs.

  13. Na stránce Připojit zdroj dat do pole Název účtu nebo adresa URL zadejte https://fabrictutorialdata.blob.core.windows.net/sampledata/.

  14. Všimněte si, že rozevírací seznam Název připojení je automaticky naplněn a že typ ověřování je nastavený na Anonymní.

    Snímek obrazovky okna Připojit ke zdroji dat zobrazující všechna nastavení

  15. Vyberte Připojit.

  16. Na stránce Zdroj, abyste měli přístup k souborům Parquet v datovém zdroji, proveďte následující nastavení:

    1. Do polí Cesta k souboru zadejte:

      1. Cesta k souboru – Kontejner:sampledata

      2. Cesta k souboru – adresář:WideWorldImportersDW/tables

      3. Cesta k souboru – název souboru:dimension_customer.parquet

    2. V rozevíracím seznamu Formát souboru vyberte Parquet.

  17. Pokud chcete zobrazit náhled dat a otestovat, že nedošlo k žádným chybám, vyberte náhled dat.

    snímek obrazovky stránky Zdroj, ukazující zvýraznění změn provedených v předchozích krocích a funkci Náhled dat

  18. Na stránce Cílová v rozevíracím seznamu Připojení vyberte sklad .

  19. U možnosti Tabulkavyberte možnost Automaticky vytvořit tabulku.

  20. Do prvního pole tabulky zadejte dbo.

  21. Do druhého pole zadejte dimension_customer.

    snímek obrazovky s cílovou stránkou a zvýrazněním místa, kde byly provedeny změny provedené v předchozích krocích.

  22. Na pásu karet Domů vyberte Spustit.

  23. V dialogovém okně Uložit a spustit? vyberte Uložit a spustit, aby datový tok načetl tabulku dimension_customer.

    snímek obrazovky s dialogovým oknem Uložit a spustit a zvýrazněným tlačítkem Uložit a spustit

  24. Pro monitorování průběhu kopírovací aktivity zkontrolujte aktivity spuštění pipeline na stránce Výstup (počkejte na dokončení se stavem Úspěšný).

    snímek obrazovky stránky Výstup se zvýrazněním stavu Úspěšný

Další krok