Migrace dat a kanálů z Azure Synapse Analytics do Microsoft Fabric
Prvním krokem při migraci dat a kanálů je identifikace dat, která chcete zpřístupnit ve OneLake, a kanály, které chcete přesunout.
Pro migraci dat máte dvě možnosti:
- Možnost 1: Azure Data Lake Storage (ADLS) Gen2 jako výchozí úložiště Pokud aktuálně používáte ADLS Gen2 a chcete se vyhnout kopírování dat, zvažte použití klávesových zkratek OneLake.
- Možnost 2: OneLake jako výchozí úložiště Pokud chcete přejít z ADLS Gen2 na OneLake jako vrstvu úložiště, zvažte čtení a zápis z/do OneLake z poznámkových bloků a definic úloh Sparku.
Migrace dat
Možnost 1: ADLS Gen2 jako úložiště (klávesové zkratky)
Pokud pracujete s ADLS Gen2 a chcete se vyhnout duplikaci dat, můžete ve OneLake vytvořit zástupce zdrojové cesty ADLS Gen2. Klávesové zkratky můžete vytvořit v oddílech Soubory a tabulky v lakehouse v prostředcích infrastruktury s následujícími aspekty:
- Oddíl Soubory je nespravovaná oblast jezera. Pokud jsou vaše data ve formátu CSV, JSON nebo Parquet, doporučujeme vytvořit zástupce této oblasti.
- Oddíl Tabulky je spravovaná oblast jezera. Tady jsou zaregistrované všechny tabulky spravované Sparkem i nespravované tabulky. Pokud jsou vaše data ve formátu Delta, můžete v této oblasti vytvořit zástupce a proces automatického zjišťování tyto tabulky Delta automaticky zaregistruje v metastoru lakehouse.
Přečtěte si další informace o vytvoření zástupce ADLS Gen2.
Možnost 2: OneLake jako úložiště
Pokud chcete oneLake použít jako vrstvu úložiště a přesunout data z ADLS Gen2, měli byste nejprve nasměrovat položky související se Sparkem Azure Synapse na OneLake a pak přenést existující data do OneLake. Pokud jde o předchozí verzi, podívejte se na integraci OneLake s Azure Synapse Sparkem.
Pokud chcete přesunout existující data do OneLake, máte několik možností:
- mssparkutils fastcp: Knihovna mssparkutils poskytuje rozhraní API fastcp, které umožňuje kopírovat data mezi ADLS Gen2 a OneLake.
- AzCopy: Ke kopírování dat z ADLS Gen2 do OneLake můžete použít nástroj příkazového řádku AzCopy.
- Azure Data Factory, Azure Synapse Analytics a Data Factory v prostředcích infrastruktury: Kopírování dat do jezera pomocí aktivity kopírování
- Klávesové zkratky: Historická data ADLS Gen2 můžete ve OneLake povolit pomocí klávesových zkratek. Není potřeba žádná kopie dat.
- Průzkumník služby Azure Storage: Soubory můžete přesunout z umístění ADLS Gen2 do OneLake pomocí Průzkumník služby Azure Storage. Podívejte se, jak integrovat OneLake s Průzkumník služby Azure Storage.
Migrace kanálů (aktivity související se Sparkem)
Pokud vaše datové kanály Azure Synapse zahrnují aktivity definice poznámkových bloků nebo úloh Sparku, budete muset tyto kanály přesunout z Azure Synapse do datových kanálů služby Data Factory v prostředcích infrastruktury a odkazovat na cílové poznámkové bloky. Aktivita poznámkového bloku je dostupná v datových kanálech služby Data Factory. Tady najdete všechny podporované aktivity datového kanálu v prostředcích infrastruktury.
- Informace o aktivitách datových kanálů souvisejících se Sparkem najdete v rozdílech mezi Azure Synapse Sparkem a prostředky infrastruktury.
- Informace o migraci poznámkových bloků najdete v tématu Migrace poznámkových bloků z Azure Synapse do prostředků infrastruktury.
- Informace o migraci datových kanálů najdete v tématu Migrace do služby Data Factory v prostředcích infrastruktury.