Tietojen ja putkien siirtäminen Azure Synapse Analyticsista Microsoft Fabriciin
Tietojen ja jakson siirtämisen ensimmäinen vaihe on tunnistaa tiedot, jotka haluat tuoda käytettäviksi OneLakessa, ja putket, jotka aiot siirtää.
Tietojen siirtämiseen on kaksi vaihtoehtoa:
- Vaihtoehto 1: Azure Data Lake Storage (ADLS) Gen2 oletussäilönä. Jos käytät tällä hetkellä ADLS Gen2 :ta ja haluat välttää tietojen kopiointia, harkitse OneLake-pikakuvakkeiden käyttämistä.
- Vaihtoehto 2: OneLake oletussäilönä. Jos haluat siirtyä ADLS Gen2:sta OneLakeen tallennuskerroksena, harkitse lukemista/kirjoittamista onelakesta muistikirjoistasi ja Spark-työmääritelmistäsi.
Tietojen siirto
Vaihtoehto 1: ADLS Gen2 tallennustilana (pikanäppäimet)
Jos olet vuorovaikutuksessa ADLS Gen2:n kanssa ja haluat välttää tietojen päällekkäisyyttä, voit luoda pikakuvakkeen ADLS Gen2 -lähdepolkuun OneLakessa. Voit luoda pikakuvakkeita Fabric-lakehousen Tiedostot ja taulukot - osioon seuraavasti:
- Tiedostot-osa on Lake-järven hallitsematon alue. Jos tiedot ovat CSV-, JSON- tai Parquet-muodossa, suosittelemme pikakuvakkeen luomista tälle alueelle.
- Taulukot-osa on Lake-järven hallittu alue. Kaikki taulukot, sekä Spark-hallitut että hallitsemattomat taulukot, on rekisteröity täällä. Jos tiedot ovat Delta-muodossa, voit luoda pikakuvakkeen tälle alueelle ja automaattinen etsintäprosessi rekisteröi nämä Delta-taulukot automaattisesti Lakehousen metakaupassa.
Lue lisätietoja ADLS Gen2 -pikakuvakkeen luomisesta.
Vaihtoehto 2: OneLake tallennustilana
Jos haluat käyttää OneLakea tallennuskerroksena ja siirtää tietoja ADLS Gen2:sta, osoita ensin Azure Synapse Sparkiin liittyviä kohteita OneLakeen ja siirrä sitten olemassa olevat tiedot OneLakeen. Katso ensin mainituista kohdasta OneLaken integrointi Azure Synapse Sparkiin.
Jos haluat siirtää olemassa olevat tiedot OneLakeen, sinulla on useita vaihtoehtoja:
- mssparkutils fastcp: Mssparkutils-kirjasto tarjoaa fastcp-ohjelmointirajapinnan, jonka avulla voit kopioida tietoja ADLS Gen2:n ja OneLaken välillä.
- AzCopy: Voit kopioida tietoja ADLS Gen2:sta OneLakeen käyttämällä AzCopy-komentoriviapuohjelmaa .
- Azure Data Factory, Azure Synapse Analytics ja Data Factory in Fabric: Kopioi tiedot Lakehouse-järjestelmään kopiointitoiminnon avulla.
- Käytä pikanäppäimiä: Voit ottaa ADLS Gen2:n historialliset tiedot käyttöön OneLakessa pikakuvakkeiden avulla. Tietojen kopiointia ei tarvita.
- Azure-tallennus Explorer: Voit siirtää tiedostoja ADLS Gen2 -sijainnista OneLakeen Azure-tallennus Explorerin avulla. Katso, miten voit integroida OneLaken Azure-tallennus Explorerin kanssa.
Jaksojen siirto (Spark-liittyvät toiminnot)
Jos Azure Synapse tietoputkesi sisältävät muistikirja- ja/tai Spark-työnmääritystoimia, kyseiset putket on siirrettävä Azure Synapse Fabricin Data Factory -tietoputkiin ja viitattava kohdemuistikirjoihin. Muistikirja-toiminta on käytettävissä Data Factory -tietoputkissa. Katso kaikki Fabricissa tuetut tietoputkitoiminnot täältä.
- Sparkiin liittyviä tietoputkitoimia koskevia näkökohtia on artikkelissa Azure Synapse Sparkin ja Fabricin väliset erot.
- Katso muistikirjojen siirtoa kohdasta Muistikirjojen siirtäminen Azure Synapse Fabriciin.
- Lisätietoja tietoputkien siirtämisesta on kohdassa Siirtyminen Fabricin Data Factoryen.