Fabric Data Warehousen suorituskykyohjeet
Koskee:✅ Microsoft Fabric -varasto
Nämä ohjeet auttavat ymmärtämään Microsoft Fabric -varastosi suorituskykyä. Tässä artikkelissa on ohjeita ja tärkeitä artikkeleita, joihin kannattaa keskittyä. Microsoft Fabricin Varasto on SaaS-ympäristö, jossa toimintoja, kuten kuormituksen hallintaa, samanaikaiuutta ja tallennustilan hallintaa, hallitaan sisäisesti käyttöympäristössä. Sisäisen suorituskyvyn hallinnan lisäksi voit silti parantaa suorituskykyä kehittämällä suorituskykyisiä kyselyjä hyvin suunniteltuja varastoja vastaan.
Kylmäajon (kylmä välimuisti) suorituskyky
Paikallisen SSD:n ja muistin välimuistiin tallentaminen on automaattista. Kyselyn ensimmäiset 1–3 suoritusta toimivat huomattavasti hitaammin kuin myöhemmät suoritusten. Jos koet kylmäajon suorituskykyongelmia, voit parantaa kylmäsuorituskykysi parilla eri tavalla:
Jos ensimmäisen suorituksen suorituskyky on ratkaiseva, yritä luoda tilastotietoja manuaalisesti. Tilastotiedot-artikkelista saat paremman käsityksen tilastojen roolista ja ohjeita siitä, miten voit luoda manuaalisia tilastoja kyselyiden suorituskyvyn parantamiseksi. Jos kuitenkin ensimmäisen suorituksen suorituskyky ei ole ratkaiseva, voit luottaa automaattisiin tilastotietoihin, jotka luodaan ensimmäisessä kyselyssä ja joita hyödyndetään jatkossakin myöhemmissä suorituksissa (kunhan pohjana olevat tiedot eivät muutu merkittävästi).
Jos käytät Power BI:tä, käytä Direct Lake - tilaa mahdollisuuksien mukaan.
Suorituskyvyn valvonnan mittarit
Tällä hetkellä valvontakeskus ei sisällä Warehousea. Jos valitset Tietovarasto, et voi käyttää valvontakeskusta siirtymispalkista.
Fabric-järjestelmänvalvojat voivat käyttää kapasiteetin käyttö- ja mittariraporttia ajantasaisia tietoja varten, jotka seuraavat Warehousen sisältävän kapasiteetin käyttöä.
Käytä dynaamisia hallintanäkymiä (DMV) kyselyn suorittamisen seurantaan
Dynaamisten hallintanäkymien avulla voit valvoa yhteyttä, istuntoa ja pyynnön tilaa varastossa.
Tilastotiedot
Varasto käyttää kyselymoduulia luodakseen suoritussuunnitelman tietylle SQL-kyselylle. Kun lähetät kyselyn, kyselyn optimoija yrittää luetteloida kaikki mahdolliset palvelupaketit ja valita tehokkaimman ehdokkaan. Määrittääkseen, mikä suunnitelma edellyttäisi vähiten yleiskustannuksia, moduulin on pystyttävä arvioimaan kunkin operaattorin mahdollisesti käsittelemien töiden tai rivien määrä. Kunkin palvelupaketin kustannusten perusteella se valitsee sitten sen, jossa on pienin arvioitu työmäärä. Tilastotiedot ovat objekteja, jotka sisältävät merkityksellisiä tietoja tiedoistasi, jotta kyselyn optimoija voi arvioida nämä kustannukset.
Voit myös päivittää tilastotiedot manuaalisesti jokaisen tietojen lataamisen tai tietojen päivityksen jälkeen, jotta paras kyselysuunnitelma voidaan luoda.
Lisätietoja tilastoista ja siitä, miten voit laajentaa automaattisesti luotuja tilastoja, on artikkelissa Fabric-tietovarastoinnin tilastotiedot.
Tietojen käsittelyohjeet
Tietojen käsittely varastoon on neljä vaihtoehtoa:
- COPY (Transact-SQL)
- Tietoputket
- Tietovuot
- Varastojen välinen käsittely
Jos haluat selvittää, mikä vaihtoehto sopii sinulle parhaiten, ja tarkastella joitakin tietojen käsittelytapojen parhaita käytäntöjä, tarkista Käytä tietoja.
Ryhmän INSERT-lausekkeet eriin (vältä vinttien lisäystä)
Yhden kerran lataaminen pieneen taulukkoon, jossa on LISÄÄ-lauseke, kuten seuraavassa esimerkissä, voi olla paras tapa tarpeidesi mukaan. Jos kuitenkin joudut lataamaan tuhansia tai miljoonia rivejä koko päivän ajan, yhdentonin LISÄYKSET eivät ole optimaalisia.
INSERT INTO MyLookup VALUES (1, 'Type 1')
Ohjeita näiden tietojen kuormitusskenaarioiden käsittelemiseen on ohjeaiheessa Tietojen käsittelyn parhaat käytännöt.
Tapahtuman koon pienentäminen
Lausekkeet LISÄÄ, PÄIVITÄ ja POISTA suoritetaan tapahtumassa. Kun ne epäonnistuvat, ne on peruutettava. Jos haluat pienentää pitkien palautusten mahdollisuuksia, pienennä tapahtuman koko aina, kun se on mahdollista. Tapahtumien kokojen minimointi voidaan tehdä jakamalla LISÄÄ-, PÄIVITÄ- ja DELETE-lausekkeet osiksi. Jos sinulla on esimerkiksi LISÄÄ-toiminto, jonka odotat vievän yhden tunnin, voit jakaa LISÄÄ-kohdan neljään osaan. Jokainen juoksu lyhennetään sitten 15 minuuttiin.
Harkitse CTAS (Transact-SQL) -kielen käyttämistä taulukossa säilytettävien tietojen kirjoittamiseen DELETE-funktion käyttämisen sijaan. Jos CTAS-toiminto käyttää yhtä paljon aikaa, sen suorittaminen on turvallisempaa, koska sillä on mahdollisimman vähän tapahtumien kirjaamista, ja se voidaan peruuttaa nopeasti tarvittaessa.
Asiakassovellusten ja Microsoft Fabricin sijoittaminen
Jos käytät asiakassovelluksia, varmista, että käytät Microsoft Fabricia alueella, joka on lähellä asiakastietokonettasi. Asiakassovellusesimerkkejä ovat Power BI Desktop, SQL Server Management Studio ja Azure Data Studio.
Tähtirakenteen tietojen rakenteen käyttäminen
Tähtirakenne järjestää tiedot faktataulukoiksi ja dimensiotaulukoiksi. Se helpottaa analyyttista käsittelyä denormalisoimalla tiedot hyvin normalisoiduista OLTP-järjestelmistä, käsittelemällä tapahtumatietoja ja yrityksen päätietoja yleiseksi, siistityksi ja vahvistetuksi tietorakenteeksi, joka minimoi liitokset kyselyhetkellä, vähentää luettavien rivien määrää ja helpottaa koosteiden ja ryhmittelyn käsittelyä.
Lisätietoja Varaston suunnittelusta on kohdassa Tietovaraston taulukot.
Kyselyn tulosjoukkojen kokojen pienentäminen
Pienentämällä kyselyn tulosjoukkojen kokoja voit välttää suurten kyselytulosten aiheuttamat asiakaspuolen ongelmat. SQL-kyselyeditorin tulosjoukot on rajoitettu 10 000 ensimmäiseen riviin, jotta vältetään nämä ongelmat tässä selainpohjaisessa käyttöliittymässä. Jos sinun on palautettava yli 10 000 riviä, käytä SQL Server Management Studiota (SSMS) tai Azure Data Studio.
Valitse suorituskykyä varten paras tietotyyppi
Kun määrität taulukoita, käytä pienintä tietotyyppiä, joka tukee tietojasi samalla tavoin, mikä parantaa kyselyn suorituskykyä. Tämä suositus on tärkeä CHAR- ja VARCHAR-sarakkeille. Jos sarakkeen pisin arvo on 25 merkkiä, määritä sarakkeen arvoksi VARCHAR(25). Vältä määrittämästä kaikkia merkkisarakkeita, joilla on suuri oletuspituus.
Käytä kokonaislukupohjaisia tietotyyppejä, jos se on mahdollista. SORT-, JOIN- ja GROUP BY -toiminnot suoritetaan nopeammin kokonaisluvuissa kuin merkkitiedoissa.
Tuettuja tietotyyppejä ja lisätietoja on kohdassa tietotyypit.
SQL-analytiikan päätepisteiden suorituskyky
Lisätietoja ja suosituksia SQL-analytiikan päätepisteen suorituskyvystä on kohdassa SQL-analytiikan päätepisteiden suorituskykyyn liittyvät seikat.
Tietojen tiivistys
Tietojen tiivistys kokoaa pienemmät Parquet-tiedostot pienempiin, suurempiin tiedostoihin, mikä optimoi lukutoiminnot. Tämä prosessi auttaa myös hallitsemaan tehokkaasti poistettuja rivejä poistamalla ne muuttumattomista Parquet-tiedostoista. Tietojen kompakti prosessi edellyttää taulukoiden tai taulukoiden segmenttien kirjoittamista uudelleen uusiksi suorituskykyyn optimoiduiksi Parquet-tiedostoiksi. Lisätietoja on blogitekstissä: Fabric Warehousen automaattinen tietojen tiivistys.
Tietojen kompaktin prosessi on integroitu saumattomasti varastoon. Kun kyselyt suoritetaan, järjestelmä tunnistaa taulukoita, jotka voivat hyötyä tiivistymästä, ja suorittaa tarvittavat arvioinnit. Tietojen tiivistys ei käynnisty manuaalisesti.