Dela via


Förstå V-order för Microsoft Fabric Warehouse

Gäller för:✅ Warehouse i Microsoft Fabric

Lagret i Microsoft Fabric Storage använder Delta Lake-tabellformatet för alla användardata. Förutom optimeringar som tillhandahålls av Delta-formatet tillämpar ett lager optimeringar på lagring för att ge snabbare frågeprestanda i analysscenarier samtidigt som parquet-formatet bibehålls. Den här artikeln beskriver optimering av V-Order-skrivning, dess fördelar och hur du kontrollerar den.

Vad är V-Order?

V-Order är en skrivtidsoptimering till parquet-filformatet som möjliggör blixtsnabba läsningar under Microsoft Fabric-beräkningsmotorerna, till exempel Power BI, SQL, Spark och andra.

Power BI- och SQL-motorer använder Microsoft Verti-Scan-teknik och V-Ordered parquet-filer för att uppnå minnesliknande dataåtkomsttider. Spark och andra beräkningsmotorer som inte är Verti-Scan drar också nytta av de V-sorterade filerna med i genomsnitt 10 % snabbare lästider, med vissa scenarier upp till 50 %.

V-Order fungerar genom att använda särskild sortering, radgruppsdistribution, ordlistekodning och komprimering på Parquet-filer. Därför kräver beräkningsmotorer mindre nätverks-, disk- och CPU-resurser för att läsa data från lagring, vilket ger kostnadseffektivitet och prestanda. Det är 100 % kompatibelt med parquet-formatet med öppen källkod. alla parquet motorer kan läsa det som vanliga parquet filer.

Prestandaöverväganden

Tänk på följande innan du bestämmer dig för att inaktivera V-Order:

  • Microsoft Fabric Direct Lake-läget beror på V-Order.
  • I lager kan effekten av V-Order på prestanda variera beroende på tabellscheman, datavolymer, fråge- och inmatningsmönster.
  • Kontrollera att du testar hur V-Order påverkar prestanda för datainmatning och dina frågor innan du bestämmer dig för att inaktivera den. Överväg att skapa en kopia av ditt testlager med hjälp av källkontroll, inaktivera V-Order på kopian och köra datainmatnings- och frågeuppgifter för att testa prestandakonsekvenserna.

Scenarier där V-order kanske inte är fördelaktigt

Överväg effekten av V-Order på prestanda innan du bestämmer dig för om det är rätt för dig att inaktivera V-Order.

Varning

För närvarande går det bara att inaktivera V-Order på lagernivå och det går inte att ångra: när den har inaktiverats kan den inte aktiveras igen. Användarna måste ta hänsyn till prestandan om de väljer att inaktivera V-order i Infrastrukturlager.

Att inaktivera V-Order kan vara användbart för skrivintensiva lager, till exempel för lager som är dedikerade till mellanlagringsdata som en del av en datainmatningsprocess. Mellanlagringstabeller tas ofta bort och återskapas (eller trunkeras) för att bearbeta nya data. Dessa mellanlagringstabeller kan då vara skrivskyddade en eller två gånger, vilket kanske inte motiverar inmatningstiden som läggs till genom att tillämpa V-Order. Genom att inaktivera V-Order och minska tiden för att mata in data kan den totala tiden för att bearbeta data under inmatningsjobb minskas. I det här fallet bör du segmentera mellanlagringslagret från ditt huvudsakliga användarinriktade lager, så att analysfrågorna och Power BI kan dra nytta av V-Order.