Jaa


Delta Lake -taulukkomuodon yhteentoimivuus

Microsoft Fabricissa Delta Lake -taulukkomuoto on analytiikan vakiomuoto. Delta Lake on avoimen lähdekoodin tallennuskerros, joka tuo ACID (Atomicity, Consistency, Isolation, Durability) -tapahtumat massadata- ja analytiikkakuormitusten kanssa.

Kaikki Fabric-kokemukset tuottavat ja kuluttavat Delta Lake -taulukoita, ovat yhteentoimivuutta ajavia ja yhtenäisiä tuotekokemuksia. Yhden laskentamoduulin, kuten Fabric Data Warehousen tai Synapse Sparkin, tuottamia Delta Lake -taulukoita voi käyttää mikä tahansa toinen moduuli, kuten Power BI. Kun käytät tietoja Fabriciin, Fabric tallentaa sen oletuksena Delta-taulukkoina. Voit helposti integroida Delta Lake -taulukoita sisältäviä ulkoisia tietoja OneLake-pikakuvakkeiden avulla.

Delta Laken ominaisuudet ja Fabric-kokemukset

Yhteentoimivuuden saavuttamiseksi kaikki Fabric-käyttökokemukset ovat linjassa Delta Lake- ja Fabric-ominaisuuksien kanssa. Jotkin kokemukset voivat kirjoittaa vain Delta Lake -taulukoihin, kun taas osa voi lukea siitä.

  • Kirjoittajat: Tietovarastot, tapahtumavirrat ja viedyt Power BI:n semanttiset mallit OneLakeen
  • Lukijat: SQL-analytiikan päätepiste ja Power BI Direct Laken semanttiset mallit
  • Kirjoittajat ja lukijat: Fabric Spark -suorituspalvelu, tietovuot, tietoputket ja Kusto Query Language (KQL) -tietokannat

Seuraavassa matriisissa näkyvät Tärkeimmät Delta Lake -ominaisuudet ja niiden tuki kullekin Fabric-ominaisuudelle.

Fabric-ominaisuus Nimipohjaisten sarakkeiden yhdistämismääritykset Poistovektorit V-järjestyksen kirjoittaminen Taulukon optimointi ja ylläpito Osioiden kirjoittaminen Osioiden lukeminen Nesteklusterointi TIMESTAMP_NTZ Deltalukuohjelman/kirjoittajan versio ja taulukon oletusominaisuudet
Tietovarasto Delta Lake export Ei Kyllä Kyllä Kyllä No Kyllä No En Lukija: 3
Kirjoittaja: 7
Poista vektorit
SQL-analytiikan päätepiste Kyllä Kyllä N/A (ei käytettävissä) N/A (ei käytettävissä) N/A (ei käytettävissä) Kyllä Kyllä En N/A (ei käytettävissä)
Fabric Spark Runtime 1.3 Kyllä Kyllä Kyllä Kyllä Kyllä Kyllä Kyllä Kyllä Lukija: 1
Kirjoittaja: 2
Fabric Spark Runtime 1.2 Kyllä Kyllä Kyllä Kyllä Kyllä Kyllä Kyllä, vain luku Kyllä Lukija: 1
Kirjoittaja: 2
Fabric Spark Runtime 1.1 Kyllä No Kyllä Kyllä Kyllä Kyllä Kyllä, vain luku En Lukija: 1
Kirjoittaja: 2
Tietovuot Kyllä Kyllä Kyllä No Kyllä Kyllä Kyllä, vain luku En Lukija: 1
Kirjoittaja: 2
Tietoputket En No Kyllä En Kyllä, vain korvaaminen Kyllä Kyllä, vain luku En Lukija: 1
Kirjoittaja: 2
Power BI Direct Laken semanttiset mallit Kyllä Kyllä N/A (ei käytettävissä) N/A (ei käytettävissä) N/A (ei käytettävissä) Kyllä Kyllä En N/A (ei käytettävissä)
Power BI:n semanttisten mallien vieminen OneLakeen Kyllä N/A (ei käytettävissä) Kyllä No Kyllä N/A (ei käytettävissä) En En Lukija: 2
Kirjoittaja: 5
KQL-tietokannat Kyllä Kyllä No Ei* Kyllä Kyllä No En Lukija: 1
Kirjoittaja: 1
Tapahtumavirrat En No No No Kyllä N/A (ei käytettävissä) En En Lukija: 1
Kirjoittaja: 2

* KQL-tietokannat tarjoavat tiettyjä taulukoiden ylläpitotoimintoja, kuten säilytysominaisuuden. Tiedot poistetaan OneLaken säilytysajan päättyessä. Lisätietoja on kohdassa Yksi looginen kopio.

Muistiinpano

  • Fabric ei oletusarvoisesti kirjoita nimipohjaisten sarakkeiden yhdistämismäärityksiä. Oletusarvoinen Fabric-käyttökokemus luo taulukoita, jotka ovat yhteensopivia koko palvelussa. Kolmannen osapuolen palveluiden tuottamalla Delta Lake -järvellä saattaa olla yhteensopimattomia taulukko-ominaisuuksia.
  • Jotkin Fabric-käyttökokemukset eivät ole perineet taulukon optimointi- ja ylläpitotoimintoja, kuten lokeron kompaktin, V-järjestyksen ja vanhojen, tuloksettamattomien tiedostojen puhdistamisen. Jotta Delta Lake -taulukot pysyvät optimaalisina analytiikkaa varten, noudata taulukoiden ylläpitotoiminnon käyttö -kohdan tekniikoita, joilla voit hallita Fabricin delta-taulukoita taulukoissa, jotka on käytetty näitä kokemuksia käyttämällä.

Nykyiset rajoitukset

Tällä hetkellä Fabric ei tue näitä Delta Lake -ominaisuuksia:

  • Delta Lake 3.x Uniform
  • Käyttäjätiedot-sarakkeiden kirjoittaminen (databricks-ominaisuus)
  • Delta Live Tables (oma Databricks-ominaisuus)
  • RLE (Run Length -koodaus) otettu käyttöön tarkistuspisteen tiedostossa