Jaa


V-Order for Microsoft Fabric Warehousen ymmärtäminen

Koskee:✅ Microsoft Fabric -varasto

Microsoft Fabric -tallennustilan Varasto käyttää Delta Lake -taulukkomuotoa kaikille käyttäjätieduksille. Delta-muodon tarjoamien optimoinnit-mallin lisäksi varasto käyttää tallennustilaan optimointeja, jotta kyselyjen suorituskyky saadaan nopeammin analytiikkaskenaarioita varten ja samalla parquet-muodon noudattaminen säilytetään. Tässä artikkelissa käsitellään V-tilauksen kirjoitusten optimointia, sen etuja ja sen hallintaa.

Mikä on V-järjestys?

V-Order on kirjoitusajan optimointi parquet-tiedostomuotoon, joka mahdollistaa salamannopean lukemisen Microsoft Fabric -käsittelymoduulissa, kuten Power BI:ssä, SQL:ssä, Sparkissä ja muissa.

Power BI- ja SQL-moottorit hyödyntävät Microsoft Verti-Scan -tekniikkaa ja V-Tilattuja parquet-tiedostoja muistinkaltaisten tietojen käyttöaikojen saavuttamiseen. Spark ja muut ei-Verti-Scan käsittelymoduulit hyötyvät myös V-Tilatut tiedostot keskimäärin 10 % nopeammin lukuajat, joissa joissakin skenaarioissa jopa 50%.

V-Order toimii käyttämällä erityistä lajittelua, riviryhmän jakelua, hakemistokoodausta ja pakkausta Parquet-tiedostoissa. Tämän seurauksena laskentamoduulit tarvitsevat vähemmän verkko-, levy- ja suoritinresursseja tietojen lukemiseen tallennustilasta, mikä parantaa tehokkuutta ja suorituskykyä. Se on 100%:n yhteensopiva avoimen lähdekoodin parquet-muodon kanssa, kaikki jäsennysmoottorit voivat lukea sen tavallisina parquet-tiedostoina.

Suorituskykyyn liittyviä huomioita

Ota huomioon seuraavat seikat, ennen kuin päätät poistaa V-tilauksen käytöstä:

  • Microsoft Fabric Direct Lake -tila määräytyy V-Orderin mukaan.
  • V-järjestyksen vaikutus varastossa suorituskykyyn voi vaihdella taulukon rakenteista, tietomääristä, kyselyistä ja käsittelymalleista riippuen.
  • Testaa, miten V-järjestys vaikuttaa tietojen käsittely- ja kyselyjen suorituskykyyn, ennen kuin päätät poistaa sen käytöstä. Harkitse kopion luomista testivarastosta lähdeohjausobjektin avulla, V-Järjestyksen poistamista käytöstä kopiossa, tietojen käsittely ja kyselyjen suorittaminen tehtävien testaamiseksi.

Skenaariot, joissa V-Order ei välttämättä ole hyödyllinen

Mieti V-järjestyksen vaikutusta suorituskykyyn, ennen kuin päätät, sopiiko V-järjestyksen poistaminen käytöstä.

Varoitus

Tällä hetkellä V-Orderin poistaminen käytöstä voidaan tehdä vain varastotasolla. Se on peruuttamaton: kun se on poistettu käytöstä, sitä ei voi ottaa käyttöön uudelleen. Käyttäjien on otettava huomioon suorituskyky, jos he päättävät poistaa V-tilauksen käytöstä Fabric Warehousessa.

V-järjestyksen poistamisesta käytöstä voi olla hyötyä paljon kirjoitustehoa vaativille varastoille, esimerkiksi varastoille, jotka on varattu valmistelutieduksille tietojen käsittelyprosessin osana. Valmistelutaulukot pudotetaan ja luodaan uudelleen (tai katkaistaan) uusien tietojen käsittelyä varten. Nämä valmistelutaulukot voidaan sitten lukea vain kerran tai kaksi, mikä ei välttämättä oikeuta V-Orderin avulla lisättyä käsittelyaikaa. Jos poistat näennäisjärjestyksen käytöstä ja tietojen käsittelyyn kuluu vähemmän aikaa, yleinen aika tietojen käsittelyyn käsittelytöiden aikana saattaa vähentyä. Tässä tapauksessa sinun tulee segmentoida valmisteluvarasto pääkäyttäjälle suunnatusta varastosta, jotta analytiikkakyselyt ja Power BI voivat hyötyä V-tilauksesta.