Tabulky v datových skladech v Microsoft Fabric
Platí pro:✅ Warehouse v Microsoft Fabric
Tento článek podrobně popisuje klíčové koncepty návrhu tabulek v Microsoft Fabric.
V tabulkách jsou data logicky uspořádaná ve formátu řádků a sloupců. Každý řádek představuje jedinečný záznam a každý sloupec představuje pole v záznamu.
- Tabulky ve skladu jsou databázové objekty, které obsahují všechna transakční data.
Určení kategorie tabulky
Hvězdicové schéma uspořádá data do tabulek faktů a tabulek dimenzí. Některé tabulky se používají pro integraci nebo přípravná data před přechodem na tabulku faktů nebo dimenzí. Při návrhu tabulky se rozhodněte, jestli data tabulky patří do faktu, dimenze nebo integrační tabulky. Toto rozhodnutí informuje příslušnou strukturu tabulky.
Tabulky faktů obsahují kvantitativní data, která se běžně generují v transakčním systému, a pak se načtou do datového skladu. Například maloobchodní firma generuje prodejní transakce každý den a pak načte data do tabulky faktů datového skladu pro účely analýzy.
Tabulky dimenzí obsahují data atributů, která se můžou změnit, ale obvykle se mění jen zřídka. Například jméno a adresa zákazníka se ukládají v tabulce dimenzí a aktualizují se jenom v případě, že se profil zákazníka změní. Aby se minimalizovala velikost velké tabulky faktů, nemusí být jméno a adresa zákazníka na každém řádku tabulky faktů. Místo toho může tabulka faktů a tabulka dimenzí sdílet ID zákazníka. Dotaz může spojit dvě tabulky a přidružit profil a transakce zákazníka.
Integrační tabulky poskytují místo pro integraci nebo přípravu dat. Můžete například načíst data do pracovní tabulky, provést transformace dat v přípravné fázi a pak je vložit do produkční tabulky.
Tabulka ukládá data ve OneLake jako součást skladu. Tabulka a data se zachovají bez ohledu na to, jestli je relace otevřená.
Tabulky ve skladu
Pokud chcete zobrazit uspořádání tabulek, můžete použít fact
dim
, nebo int
jako předpony názvů tabulek. Následující tabulka uvádí některé názvy schémat a tabulek pro ukázkový datový sklad WideWorldImportersDW .
Název zdrojové tabulky WideWorldImportersDW | Typ tabulky | Název tabulky datového skladu |
---|---|---|
City | Dimenze | wwi.DimCity |
Objednávka | Fakt | wwi.FactOrder |
- U názvů tabulky se rozlišují velká a malá písmena.
- Názvy tabulek nemůžou obsahovat
/
ani\
končit tečkou.
.
Vytvoření tabulky
Pro Sklad můžete vytvořit tabulku jako novou prázdnou tabulku. Můžete také vytvořit a naplnit tabulku výsledky příkazu select. Následují příkazy T-SQL pro vytvoření tabulky.
Příkaz T-SQL | Popis |
---|---|
CREATE TABLE | Vytvoří prázdnou tabulku definováním všech sloupců a možností tabulky. |
CREATE TABLE AS SELECT | Naplní novou tabulku výsledky příkazu select. Sloupce tabulky a datové typy jsou založené na výsledcích příkazu select. Pokud chcete importovat data, můžete tento příkaz vybrat z externí tabulky. |
Tento příklad vytvoří tabulku se dvěma sloupci:
CREATE TABLE MyTable (col1 int, col2 int );
Názvy schématu
Warehouse podporuje vytváření vlastních schémat. Podobně jako v SQL Serveru jsou schémata dobrým způsobem, jak seskupit objekty, které se používají podobným způsobem. Následující kód vytvoří uživatelem definované schéma s názvem wwi
.
- V názvech schémat se rozlišují malá a velká písmena.
- Názvy schémat nemohou obsahovat
/
ani\
končit písmenem.
.
CREATE SCHEMA wwi;
Datové typy
Microsoft Fabric podporuje nejčastěji používané datové typy T-SQL.
- Další informace o datových typech najdete v tématu Datové typy v Microsoft Fabric.
- Při vytváření tabulky ve skladu zkontrolujte odkazy na datové typy v CREATE TABLE (Transact-SQL).
- Průvodce vytvořením tabulky ve skladu najdete v tématu Vytvoření tabulek.
Kolace
Latin1_General_100_BIN2_UTF8
V současné době je výchozí a podporuje se pouze kolace pro tabulky i metadata.
Statistika
Optimalizátor dotazů používá statistiky na úrovni sloupců při vytváření plánu pro provádění dotazu. Pokud chcete zvýšit výkon dotazů, je důležité mít statistiky o jednotlivých sloupcích, zejména sloupcích používaných ve spojeních dotazů. Warehouse podporuje automatické vytváření statistik.
Statistické aktualizace se neprovádí automaticky. Aktualizujte statistiky po přidání nebo změně významného počtu řádků. Například po načtení aktualizujte statistiky. Další informace najdete v článku Statistika.
Primární klíč, cizí klíč a jedinečný klíč
Pro sklad, PRIMÁRNÍ KLÍČ a JEDINEČNÉ omezení jsou podporovány pouze v případě, že se používají neclustered a NOT VYNUCENé.
CIZÍ KLÍČ je podporován pouze v případech, kdy se používá NOT VYNUCENO.
- V případě syntaxe zaškrtněte příkaz ALTER TABLE.
- Další informace najdete v tématu Primární klíče, cizí klíče a jedinečné klíče ve skladu v Microsoft Fabric.
Zarovnání zdrojových dat s datovým skladem
Tabulky skladu se naplní načtením dat z jiného zdroje dat. Aby bylo dosaženo úspěšného načtení, musí počet a datové typy sloupců ve zdrojových datech odpovídat definici tabulky v datovém skladu.
Pokud data pocházejí z více úložišť dat, můžete je přenést do datového skladu a uložit je do integrační tabulky. Jakmile jsou data v tabulce integrace, můžete k implementaci transformačních operací použít výkon datového skladu. Jakmile jsou data připravená, můžete je vložit do produkčních tabulek.
Omezení
Warehouse podporuje mnoho funkcí tabulek nabízených jinými databázemi, ale ne všechny.
Následující seznam obsahuje některé z funkcí tabulky, které nejsou aktuálně podporované.
- Maximálně 1024 sloupců na tabulku
- Počítané sloupce
- Indexovaná zobrazení
- Dělené tabulky
- Sequence
- Řídké sloupce
- Náhradní klíče u číselných sekvencí se sloupci Identity
- Synonyma
- Dočasné tabulky
- Aktivační události
- Jedinečné indexy
- Uživateli definované typy
Důležité
Při použití správy zdrojového kódu se skladem existují omezení nebo sloupce při přidávání omezení tabulky nebo sloupců.