Common Data Model- tietolähteen päivittäminen käyttämään Delta-taulukoita
Päivitä olemassa oleva tietoyhteys Common Data Model -taulukoilla ja siirry Delta-muotoisiin taulukkoihin poistamatta ja luomatta uudelleen olemassa olevaa määritystä, joka on riippuvainen tietoyhteydestä.
Tärkeitä syitä muodostaa yhteys Delta-muodossa tallennettuihin tietoihin:
- Tuo Delta-muotoillut tiedot suoraan, jolloin säästyy aikaa ja vaivaa.
- Eliminoi laskenta- ja tallennuskustannukset, jotka liittyvät Lakehouse-tietojen muuntamiseen ja tallentamiseen.
- Paranna automaattisesti tietojen käsittelyn luotettavuutta Customer Insights - Datassa Delta-versioinnin mukaan.
Delta on Delta Laken esittelemä termi. Se on tietojen ja taulukoiden tallentamisen perusta Databricks Lakehouse Platformissa. Delta Lake avoimen lähdekoodin tallennustilakerros, joka tuo ACID-tapahtumat (yksittäisyys, yhdenmukaisuus, eristys ja kestävyys) ison datan työkuormiin. Lisätietoja on Delta Lake -dokumentaatiosivulla.
edellytykset
Azure Data Lake Storagen on oltava samassa vuokraajassa ja samalla Azure-alueella kuin Customer Insights - Data.
Jos haluat muodostaa yhteyden palomuurien suojaamaan tallennustilaan, määritä Azure yksityiset linkit.
Customer Insights - Data -päänimellä on oltava Storage Blob Data Contributor -oikeudet tallennustilin käyttöön. Lisätietoja on kohdassa Tallennustilin käyttöön tarvittavien oikeuksien myöntäminen palvelun päänimelle.
Käyttäjä, joka määrittää tai päivittää tietolähteen, tarvitsee vähintään Storage Blob Data Reader -käyttöoikeudet Azure Data Lake Storage -tiliin.
Online-palveluihin tallennetut tiedot voivat olla tallennettu eri sijaintiin kuin missä tietoja käsitellään ja mihin ne tallennetaan. Tuomalla verkkopalveluun tallennetut tiedot tai muodostamalla niihin yhteyden hyväksyt, että tiedot voidaan siirtää. Lisätietoja on Microsoftin luottamuskeskuksessa.
Customer Insights - Data tukee Databricks-lukijan versiota 2. Delta-taulukkoja, jotka käyttävät vähintään Databricks-readerin versiota 3 vaativia ominaisuuksia, ei tueta. Lisätietoja: Tuetut Databricks-ominaisuudet.
Delta-taulukoiden on oltava varastosäilön kansiossa. Ne eivät voi olla säilön juurihakemistossa. Esimerkki:
storageaccountcontainer/ DeltaDataRoot/ ADeltaTable/ _delta_log/ 0000.json 0001.json part-0001-snappy.parquet part-0002-snappy.parquet
Delta-taulukoiden ja niiden rakenteen on vastattava olemassa olevan Common Data Model -tietolähteen taulukoita ja oltava samassa tallennussäiliössä. Uuden tietokansion taulukoiden on vastattava tarkasti Common Data Model -tietolähteen valittuja taulukoita. Taulukoiden nimien ja niiden rakenteiden tulee vastata täsmälleen toisiaan. Deltassa taulukoiden nimet ovat samat kuin kansion nimi, johon tiedot on tallennettu. Siksi kansionimien on vastattava tarkasti Common Data Model -tietolähteen valittuja taulukoita. Muussa tapauksessa päivitys epäonnistuu.
Jos esimerkiksi valitut Common Data Model -tietolähteen taulukot ovat Taulukko1 ja Taulukko2, päivitykselle valitsemasi kansion on näytettävä hierarkiassa Taulukko1 ja Taulukko2.
storageaccountroot/ DeltaDataRoot/ Table1/ Table2/
Common Data Model -tietotaulukkojen päivittäminen Delta-taulukoiksi
Valitse Tiedot>Tietolähteet.
Valitse Azure Data Lake Common Data Model -tietolähde ja valitse sitten Päivitä Delta-taulukkoon. Tai valitse Aloita päivitys Lisää taulukoita -sivulta, jos muokkaat Common Data Model -tietolähdettä.
Valitse Selaa ja siirry kansioon, joka sisältää tiedot Delta-muodossa ja joka vastaa täsmälleen valittua Azure Data Lake -tietolähteen taulukkoa. Valitse se ja valitse sitten Päivitä tietolähde.
Avautuvalla Tietolähteet-sivulla on näkyy uusi tietolähde, jonka tilana on Päivitetään.
Tärkeää
Älä lopeta päivitysprosessia, sillä se voi vaikuttaa negatiivisesti tietolähteen päivittämiseen.
Vihje
Tehtäville ja prosesseille on määritetty tilat. Useimmat prosessit riippuvat muista alkuvaiheen prosesseista, kuten tietolähteistä ja tietojen profiloinnin päivityksistä.
Valitse tila, jos haluat avata Edistymisen tiedot -ruudun ja tarkastella tehtävien edistymistä. Peruuta työ valitsemalla ruudun alareunassa Peruuta työ.
Valitse jokaisen tehtävän alta Näytä tiedot -linkki, jos haluat lisätietoja esimerkiksi käsittelyajasta, viimeisestä käsittelypäivästä sekä tehtävään tai prosessiin liittyvistä virheistä ja varoituksia. Valitsemalla paneelin alareunassa Näytä järjestelmän tili saat muut järjestelmän prosessit näkyviin.
Suosittelemme, että jatkat tietojen siirtoa Data Lake Storage -sijaintiin nykyisen putkesi kautta ja ylläpidät luetteloita ja skeemoja, kunnes toteat päivityksen onnistuneen ja kaiken toimivan odotetulla tavalla.
Palauta muunto Common Data Model -taulukoista Delta-taulukoiksi
Jos yritit päivittää Azure Data Laken Common Data Model -tietolähteen Delta-taulukoiksi ja prosessi epäonnistuu, suorita seuraavat vaiheet.
edellytykset
- Organisaatiosi on jatkanut Data Lake Storage -tietojen siirtoa putken kautta.
- Organisaatiosi on ylläpitänyt Data Lake Storage -luetteloita ja -skeemoja.
Palauttaminen takaisin Azure Data Laken Common Data Model -tietolähteeseen
Valitse Tiedot>Tietolähteet.
Valitse Azure Data Lake Common Data Model -tietolähde ja valitse sitten Palauta Common Data Model -taulukoihin.
Vahvista, että haluat palauttaa. Avautuvalla Tietolähteet-sivulla on näkyy uusi tietolähde, jonka tilana on Päivitetään.
Tärkeää
Älä lopeta päivitysprosessia, sillä se voi vaikuttaa negatiivisesti tietolähteen palauttamiseen.