Azure Synapse Linkin lisämääritysten asetukset
Azure Synapse Link tarjoaa useita tapoja kirjoittaa ja lukea tietoja erilaisiin analyysiskenaarioihin sopiviksi. Analyysiskenaariosta riippuen voit valita tietyn määrityksen alla olevista vaihtoehdoista.
Skenaario | Koskee | Käytettävissä olevat määritysasetukset |
---|---|---|
Toiminnan raportointi | Dataverse-taulukot, talous- ja toimintotaulukot ja -entiteetit | Synapse Analytics ja Delta Lake -vaihtoehto tarjoaa paremmat kyselyjen vasteajat, joita voidaan käyttää erityisesti suurten tietomäärien kyselyihin. Lisätietoja: Synapse Link ja Delta Lake -vaihtoehto |
Toiminnan raportointi | Vain Dataverse-taulukot | Synapse Link, jossa on ”Paikalla päivitys” -määritysvaihtoehto, tarjoaa Data Lake -tallennustilassasi olevat CSV-tiedostot, jotka päivitetään lähes reaaliajassa Tämä on Dataverse-taulukoille käytettävissä oleva vanha vaihtoehto. Tätä vaihtoehtoa ei tueta talous- ja toimintosovellusten taulukoille |
Tietojen integrointi | Dataverse-taulukot sekä talous- ja toimintotaulukot ja -entiteetit | Vain liittäminen -vaihtoehto tarjoaa CSV-tiedostot, jotka sisältävät lisääviä tietoja. Voit luoda putkia, jotka kuluttavat lisääviä tietoja ja täyttävät loppupään järjestelmät Käyttäjän määrittämä tieto-osio -ominaisuus mahdollistaa mukautetun tietojen osioinnin strategian valitsemisen erityisesti Dataverse-taulukoille. Järjestelmä jakaa talous- ja toimintotaulukoiden tiedot soveltuvan osiointistrategian perusteella. Tämä vaihtoehto ei ole käytössä talous- ja toimintosovelluksille |
Muistiinpano
Azure Synapse Link for Dataverse tunnettiin aiemmin nimellä Vie Data Lake -tallennustilaan. Palvelu nimettiin uudelleen toukokuussa 2021, ja se jatkaa tietojen vientiä Azure Data Lake Storage -tallennustilaan ja Azure Synapse Analyticsiin. Syyskuusta 2023 alkaen Azure Synapse Link mahdollistaa myös tietojen valitsemisen Dynamics 365:n talous- ja toimintosovelluksista. Talous- ja toimintosovellukset eivät tue kaikkia integrointimalleja. Lisätietoja siirtymisestä talous- ja toimintosovellusten Data Lake -tallennustilaan vienti -toiminnosta Synapse Linkiin on siirtymäoppaassa.
Tässä artikkelissa käsitellään Dataverse-taulukoille käytettävissä olevia lisämääritysasetuksia. Nämä vaihtoehdot eivät ole käytössä talous- ja toimintosovelluksille.
- Paikallaan-päivitykset verrattuna vain lisäys -kirjauksiin.
- Käyttäjän määrittämä tietojen osiointi.
Paikallaan-päivitykset verrattuna vain lisäys -kirjauksiin
Kun Dataverse-taulukon tietoja kirjoitetaan Azure Data Lake -tallennustilaan, valittavana on kaksi erilaista asetusta, ja tämä valinta perustuu createdOn
-arvoon, joka ilmaisee tietueen luontipäivämäärän ja -ajan. Valittavana on asetukset Samaan sijaintiin päivittäminen ja Vain lisäys.
Oletusasetus (taulukoissa, joissa createdOn
on käytettävissä) on samaan sijaintiin päivittäminen tai tietoja lisäävä upsert (päivitys tai lisäys) kohteessa. Jos muutos on uusi ja vastaavaa riviä ei ole uudella rivillä, luomiskohteen tapauksessa kohdetiedostot lisätään ja muutokset lisätään vastaavaan tiedoston osioon lakessa. Jos muutos on päivitys ja rivi on luotu aikaisemmin Data Lake -tallennustilaan, vastaa Data Lake -tiedosto päivitetään lisäävillä tiedoilla sen sijaan, että ne lisättäisiin. Toisin sanoen kaikkien sellaisten Dataverse-taulukoiden, joissa createdOn
on saatavana, CUD (luonti, päivitys ja poisto) -muutosten oletusasetus on samaan sijaintiin päivittäminen kohteessa eli Azure Data Lake -tallennustilassa.
Oletusarvoisen samaan sijaintiin päivittämisen voi vaihtaa käyttämällä valinnaista Vain lisäys -asetusta. Samaan sijaintiin päivityksen sijaan Vain lisäys -tilassa Dataverse-taulukoiden lisäävät tiedot lisätään vastaavaan tiedosto-osioon Data Lake -tallennustilassa: Tämä taulukkokohtainen asetus on käytettävissä valintaruutuna kohdassaLisäasetukset>Näytä lisämääritysasetukset. Jos Vain lisäys on otettu käyttöön Dataverse-taulukossa, kaikki CUD-muutokset lisätään lisäävästi vastaaviin Data Lake -tallennustilan kohdetiedostoihin. Kun valitset tämän vaihtoehdon, osiostrategian oletusarvo on Vuosi ja kun tiedot kirjoitetaan Data Lake -tallennustilaan, ne jakautuvat vuosittain. Vain liittäminen on oletusasetus Dataverse-taulukoille , joissa ei ole createdOn
-arvoa.
Tässä taulukossa käsitellään rivien käsittelyä Data Lake -tallennustilassa CUD-tapahtumien perusteella kunkin tietojen kirjoitusvaihtoehdon osalta.
Tapahtuma | Samaan sijaintiin päivittäminen | Vain lisäys |
---|---|---|
Luo | Rivi lisätään osiointitiedostoon rivin createdOn -arvon perusteella. |
Rivi lisätään osiointitiedoston loppuun tietueen createdOn -arvon perusteella. |
Päivitys | Jos rivi on osiotiedostossa, se korvataan tai päivitetään päivitetyllä tiedolla. Jos sitä ei ole luotu, se lisätään tiedostoon. | Rivi ja päivitetty versio lisätään osiointitiedoston loppuun. |
Delete | Jos rivi on luotu osiointitiedostoon, se poistetaan tiedostosta. | Rivi lisätään osiointitiedoston loppuun ja siinä on arvoIsDelete column = True . |
Muistiinpano
Jos Vain lisäys on otettu käyttöön Dataverse-taulukossa, rivin poistaminen lähteessä ei poista riviä Data Lake -tallennustilassa. Poistettu rivi lisätään sen sijaan uutena rivinä Data Lake -tallennustilaan, ja isDeleted
-sarakkeen arvoksi määritetään Tosi.
Palvelimettoman vahvistamaton lukeminen (ALLOW_INCONSISTENT_READS) on käytössä vain lisäys -tilassa. ALLOW_INCONSISTENT_READS tarkoittaa sitä, että käyttäjä voi lukea tiedostot, joita voidaan muokata jatkuvasti SELECT
-kyselyn aikana. Tulokset ovat yhdenmukaisia ja ne vastaavat tiedoston tilannevedoksen lukemista. (Se ei vastaa tietokannan tilannevedoksen eristystä, koska tilannevedoksen luontiaika on erilainen.)
Vain lisäys ei sieppaa kaikkia CUD-muutoksia: Synapse Link käsittelee tietojen muutokset ryhminä eli erinä, ennen kuin ne julkaistaan Data Lake -tallennustilaan. Niinpä jos käyttäjä tekee tietyn lyhyen ajanjaksona aikana muutoksia, kaikkia CUD-muutoksia ei siepata Data Lake -tallennustilaan.
Seuraavassa on lisätietoja siitä, milloin kumpaakin vaihtoehtoa käytetään.
- Paikkapäivitys: Tämä asetus on oletusasetus, ja sitä suositellaan vain, jos haluat muodostaa yhteyden suoraan Data Lake -tallennustilaan ja tarvitset nykyisen tilan (ei historiatietoja tai vaiheittaisia muutoksia). Tiedosto sisältää koko tietojoukon ja sitä voidaan käyttää Power BI:ssa tai kopioimalla koko ETL (purku, siirto, lataus) -putkien tietojoukko.
- Vain lisäys: Tämä vaihtoehto valitaan, jos Data Lake -tallennustilan tietoihin ei muodosteta suoraan yhteyttä ja tiedot halutaan kopioida lisäävästi toiseen kohteeseen ETL-putkien avulla. Tämä vaihtoehto sisältää muutoslokin, minkä ansiosta tekoäly- ja koneoppimisskenaariot voidaan ottaa käyttöön.
Voit ottaa Näytä määrityksen lisäasetukset -valinnan käyttöön kohdassa Lisäasetukset Azure Synapse Link for Dataversessa mukauttaaksesi tieto-osiostrategiaasi ja valitaksesi Azure Data Lakeen kirjoittamisen asetuksia.
Tietojen osiointi
Kun kirjoitat Dataverse-taulukkotietoja Azure data lake storageen käyttämällä Azure Synapse Linkiä, taulukot osioidaan (yksittäisen tiedoston asemesta) lakessa lähteen kunkin rivin createdOn
-arvon perusteella. Oletusosiointistrategia on kuukausittain ja tiedot jaetaan Azure data lake -tallennustilassa kuukausittain.
Dataverse-taulukon kapasiteetin ja tietojen jakelun perusteella voit jakaa tiedot vuoden mukaan. Tämän vaihtoehdon avulla, kun Dataverse-taulukon tiedot kirjoitetaan Azure data lake -tallennustilaan, ne jaetaan vuosittain kunkin lähteen rivin createdOn
-arvon perusteella. Jos taulukossa ei ole createdOn
-saraketta, tietorivit jaetaan uuteen tiedostoon viiden miljoonan tietueen välein. Tämä taulukkokohtainen asetus on käytettävissä valintaruutuna kohdassaLisäasetukset>Näytä lisämääritysasetukset.
Lisätietoja on esimerkeissä siitä, miten tietoja käsitellään lakessa vuosi- tai kuukausiosiostrategian avulla: