Nopea kopio Tietovuot Gen2:ssa
Tässä artikkelissa kuvataan Dataflows Gen2 for Data Factoryn nopea kopiointitoiminto Microsoft Fabricissa. Tietovoiden avulla voit käsitellä ja muuntaa tietoja. Kun tietovuo skaalataan ulos SQL DW -käsittelyn avulla, voit muuntaa tietoja skaalautuvassa mittakaavassa. Tietojasi on kuitenkin käytettävä ensin. Nopean kopion käyttöönoton myötä voit käyttää teratavuja tietoja, joiden käyttökokemus on helppo, mutta putken kopiointitoiminnon skaalattavan taustan ansiosta.
Kun tämä ominaisuus on otettu käyttöön, tietovuot vaihtavat taustaa automaattisesti, kun tietojen koko ylittää tietyn raja-arvon, eikä mitään tarvitse muuttaa tietovoiden laatimisen aikana. Tietovuon päivittämisen jälkeen voit tarkistaa päivityshistoriasta, käytettiinkö nopeaa kopiota suorituksen aikana, katsomalla siellä näkyvää Moduuli-tyyppiä .
Kun Edellytä nopeaa kopiointia -
Edellytykset
- Sinulla on oltava Fabric-kapasiteetti.
- Tiedostojen .csv ja parquet-muodot ovat vähintään 100 Mt ja ne on tallennettu Azure Data Lake Storage (ADLS) Gen2:een tai Blob-säilön tiliin.
- Tietokannassa, kuten Azure SQL DB:ssä ja PostgreSQL:ssä, on vähintään 5 miljoonaa riviä tietoa tietolähteessä.
Muistiinpano
Voit ohittaa raja-arvon pakottamalla nopean kopioinnin valitsemalla Edellytä nopeaa kopiota -asetuksen.
Liittimen tuki
Nopeaa kopiointia tuetaan tällä hetkellä seuraavissa Tietovuon Gen2-liittimillä:
- ADLS Gen2
- Blob-säilö
- Azure SQL DB
- Lakehouse
- PostgreSQL
- Paikallinen SQL Server
- Varasto
- Oracle
- Snowflake
Kopiointitoiminto tukee vain muutamia muunnoksia muodostettaessa yhteyttä tiedostolähteeseen:
- Yhdistä tiedostot
- Valitse sarakkeet
- Tietotyyppien muuttaminen
- Sarakkeen nimeäminen uudelleen
- Sarakkeen poistaminen
Voit edelleen käyttää muita muunnoksia jakamalla käsittely- ja muunnosvaiheet erillisiin kyselyihin. Ensimmäinen kysely todellisuudessa noutaa tiedot, ja toinen kysely viittaa sen tuloksiin, jotta DW-käsittely voidaan käyttää. SQL-lähteissä tuetaan kaikkia muunnoksia, jotka ovat osa alkuperäistä kyselyä.
Kun lataat kyselyn suoraan tulostekohteeseen, tällä hetkellä tuetaan vain Lakehouse-kohteita. Jos haluat käyttää toista tulostekohdetta, voit vaiheistaa kyselyn ensin ja viitata siihen myöhemmin.
Nopean kopion käyttäminen
Siirry asianmukaiseen Fabric-päätepisteeseen.
Siirry Premium-työtilaan ja luo tietovuo Gen2.
Valitse uuden tietovuon Aloitus-välilehdessä Asetukset:
Valitse sitten Skaalaus-välilehti Asetukset-valintaikkunassa ja valitse Salli nopeiden kopiointiliittimien käyttö -valintaruutu, jos haluat ottaa nopean kopion käyttöön. Sulje sitten Asetukset-valintaikkuna.
Valitse Nouda tiedot , valitse ADLS Gen2 -lähde ja täytä säilön tiedot.
Käytä Yhdistä tiedosto -toimintoa.
Voit varmistaa nopean kopioinnin käyttämällä vain tämän artikkelin Osassa Yhdistintuki lueteltuja muunnoksia. Jos sinun on otettava käyttöön lisää muunnoksia, vaiheista tiedot ensin ja viittaa kyselyyn myöhemmin. Tee muita muunnoksia viitatussa kyselyssä.
(Valinnainen) Voit määrittää Edellytä nopeaa kopiota -asetuksen kyselylle napsauttamalla sitä hiiren kakkospainikkeella, jotta voit valita ja ottaa sen käyttöön.
(Valinnainen) Tällä hetkellä voit määrittää lähtökohteeksi vain Lakehousen. Missä tahansa muussa kohdesijainnissa järjestä kysely ja viittaa siihen myöhemmin toisessa kyselyssä, jossa voit tulostaa mihin tahansa lähteeseen.
Tarkista nopean kopioinnin ilmaisimet, jotta näet, voiko kyselysi suorittaa nopealla kopiolla. Jos näin on, Moduuli-tyypissä näkyy CopyActivity.
Julkaise tietovuo.
Tarkista, että nopea kopio on käytössä, kun päivitys on valmis.
Kyselyn jakaminen nopean kopion hyödyntämiseksi
Jotta suorituskyky olisi optimaalinen käsiteltäessä suuria tietomääriä Dataflow Gen2:n avulla, käytä Nopea kopiointi -toimintoa tietojen ensimmäisen käsittelyn valmisteluun ja muunna se sitten mittakaavassa SQL DW -käsittelyllä. Tämä lähestymistapa parantaa merkittävästi suorituskykyä päästä päähän.
Tämän toteuttamiseen nopean kopioinnin ilmaisimet voivat opastaa kyselyn jakamisessa kahteen osaan: tietojen käsittely valmisteluun ja laajamittaiseen muuntamiseen SQL DW -käsittelyllä. Sinua kehotetaan työntämään yhtä suuri osa kyselyn arvioinnista nopeaan kopioon, jota voidaan käyttää tietojesi käsittelyä varten. Kun nopean kopioinnin ilmaisimet kertovat, että nopea kopiointi ei voi suorittaa muita vaiheita, voit jakaa loput kyselystä niin, että valmistelu on käytössä.
Vaiheen diagnostiikan ilmaisimet
Indikaattori | Ikoni | Kuvaus |
---|---|---|
Tämä vaihe arvioidaan nopealla | Nopean kopioinnin ilmaisin kertoo, että tähän vaiheeseen asti tehtävä kysely tukee nopeaa kopiota. | |
nopea ei tue tätä vaihetta | Nopean kopioinnin ilmaisin näyttää, että tämä vaihe ei tue nopeaa kopiota. | |
nopea kysely ei tue yhtä tai useampaa kyselyn vaihetta | Nopean kopioinnin ilmaisin näyttää, että jotkin tämän kyselyn vaiheet tukevat nopeaa kopiointia, kun taas toiset eivät. Jos haluat optimoida, jaa kysely: keltaiset vaiheet (mahdollisesti nopean kopion tukema) ja punaiset vaiheet (ei tueta). |
Vaiheittaiset ohjeet
Kun tietojen muunnoslogiikka on suoritettu Dataflow Gen2:ssa, nopean kopioinnin ilmaisin arvioi jokaisen vaiheen määrittääkseen, kuinka monta vaihetta voi hyödyntää nopean kopioinnin avulla suorituskyvyn parantamiseksi.
Alla olevassa esimerkissä viimeinen vaihe näyttää punaisen, mikä ilmaisee, että nopea kopiointi ei tue vaihetta, jossa on Ryhmittelyperuste. Nopea kopiointi voi kuitenkin mahdollisesti tukea kaikkia keltaista näyttämistä edeltäviä vaiheita.
Jos tällä hetkellä julkaiset ja suoritat tietovuon Gen2-työnkulun suoraan, se ei käytä nopean kopioinnin moduulia tietojesi lataamiseen alla olevan kuvan mukaisesti:
Jos haluat käyttää nopean kopioinnin moduulia ja parantaa tietovuon Gen2:n suorituskykyä, voit jakaa kyselysi kahteen osaan: tietojen käsittely valmisteluun ja suuren mittakaavan muuntamiseen SQL DW -käsittelyllä seuraavasti:
Poista muunnokset (punainen), joita nopea kopiointi ei tue, sekä kohde (jos määritetty).
Nopean kopioinnin ilmaisin näyttää nyt vihreänä jäljellä olevissa vaiheissa, mikä tarkoittaa, että ensimmäinen kyselysi voi parantaa suorituskykyä nopealla kopiolla.
Valitse ensimmäisessä kyselyssä Toiminto ja valitse sitten Ota valmistelu käyttöön ja Viittaus.
Uudessa viitatussa kyselyssä luettiin Ryhmittelyperuste-muunnos ja kohde (jos sovellettavissa).
Julkaise ja päivitä Tietovuo Gen2. Näet nyt kaksi kyselyä tietovuon Gen2-ympäristössä, ja kokonaiskesto on pitkälti pienempi.
Ensimmäinen kysely käyttää tietoja valmisteluun nopean kopion avulla.
Toinen kysely suorittaa suuren mittakaavan muunnoksia SQL DW -käsittelyn avulla.
Ensimmäinen kysely:
Toinen kysely:
Tunnetut rajoitukset
- Nopean kopion tueksi tarvitaan paikallisen tietoyhdyskäytävän versio 3000.214.2 tai uudempi versio.
- VNet-yhdyskäytävää ei tueta.
- Tietojen kirjoittamista aiemmin luotuun taulukkoon Lakehousessa ei tueta.
- Kiinteää rakennetta ei tueta.