Condividi tramite


Tabelle nel data warehousing in Microsoft Fabric.

Si applica a✅: warehouse in Microsoft Fabric

Questo articolo illustra in dettaglio i concetti chiave per la progettazione di tabelle in Microsoft Fabric.

Nelle tabelle, i dati sono organizzati in modo logico in formato a righe e colonne. Ogni riga rappresenta un record univoco e ogni colonna rappresenta un campo all'interno del record.

  • In Warehouse le tabelle sono oggetti di database che contengono tutti i dati transazionali.

Determinare la categoria della tabella

Uno schema star organizza i dati in tabelle fact e tabelle delle dimensioni. Alcune tabelle vengono usate per i dati di integrazione o di staging prima di spostarli in una tabella dei fatti o delle dimensioni. Quando si progetta una tabella, occorre decidere se i dati appartengono a una tabella fact, delle dimensioni o di integrazione. Questa decisione determina la struttura della tabella.

  • Le tabelle fact contengono i dati quantitativi che vengono comunemente generati in un sistema transazionale e successivamente caricati nel data warehouse. Un'azienda di vendita al dettaglio, ad esempio, genera quotidianamente transazioni di vendita e successivamente carica i dati in una tabella fact di data warehouse per analizzarli.

  • Le tabelle delle dimensioni contengono i dati degli attributi che possono cambiare, ma che in genere cambiano raramente. Il nome e l'indirizzo di un cliente, ad esempio, vengono archiviati in una tabella delle dimensioni e aggiornati solo quando viene modificato il profilo del cliente. Per ridurre al minimo le dimensioni di una tabella dei fatti di grandi dimensioni, si può evitare di inserire il nome e l'indirizzo del cliente in ogni riga della tabella. La tabella fact e la tabella delle dimensioni possono invece condividere un ID cliente. Una query può creare un join tra le due tabelle per associare il profilo e le transazioni di un cliente.

  • Le tabelle di integrazione sono un luogo in cui integrare o gestire temporaneamente i dati. È ad esempio possibile caricare i dati in una tabella di staging, eseguire trasformazioni sui dati in gestione temporanea e quindi inserirli in una tabella di produzione.

Una tabella archivia i dati in OneLake come parte del warehouse. La tabella e i dati sono persistenti indipendentemente dalla presenza o meno di una sessione aperta.

Tabelle nel Warehouse

Per visualizzare l'organizzazione delle tabelle, è possibile usare fact, dim o int come prefissi dei nomi delle tabelle. La tabella seguente mostra alcuni dei nomi di tabella e dello schema per il data warehouse di esempio WideWorldImportersDW.

Nome tabella sorgente WideWorldImportersDW Tipo di tabella Nome tabella data warehouse:
Città Dimensione wwi.DimCity
Ordinamento Fatto wwi.FactOrder
  • I nomi delle tabelle usano la distinzione tra maiuscole e minuscole.
  • I nomi delle tabelle non possono contenere / o \ o terminare con un ..

Crea una tabella

È possibile creare una tabella come nuova tabella vuota. È inoltre possibile creare e popolare una tabella con i risultati di un'istruzione SELECT. Di seguito sono riportati i comandi T-SQL per la creazione di una tabella.

Istruzione T-SQL Descrizione
CREATE TABLE Crea una tabella vuota definendo tutte le opzioni e le colonne della tabella.
CREATE TABLE AS SELECT Popola una nuova tabella con i risultati di un'istruzione SELECT. Le colonne e i tipi di dati della tabella si basano sui risultati dell'istruzione SELECT. Per importare i dati, questa istruzione può selezionare da una tabella esterna.

Questo esempio crea una tabella con due colonne:

CREATE TABLE MyTable (col1 int, col2 int );  

Nomi schema

Warehouse supporta la creazione di schemi personalizzati. Come in SQL Server gli schemi sono un modo valido per raggruppare le tabelle usate in modo simile. Il codice seguente crea uno schema definito dall'utente denominato wwi.

  • I nomi di schemi fanno distinzione tra maiuscole e minuscole.
  • I nomi di schemi non possono contenere / o \ o terminare con un ..
CREATE SCHEMA wwi;

Tipo di dati

Microsoft Fabric supporta i tipi di dati T-SQL usati più di frequente.

Regole di confronto

Attualmente, Latin1_General_100_BIN2_UTF8 è collage predefinito e l'unico supportato sia per le tabelle che per i metadati.

Statistiche

Quando crea il piano per l'esecuzione di una query, Query Optimizer usa le statistiche a livello di colonna. Per migliorare le prestazioni delle query, è importante avere statistiche su singole colonne, in particolare sulle colonne usate nei join delle query. Warehouse supporta la creazione automatica di statistiche.

L'aggiornamento delle statistiche non è automatico. Aggiornare le statistiche dopo l'aggiunta o la modifica di un numero significativo di righe. Aggiornare, ad esempio, le statistiche dopo un caricamento. Per ulteriori informazioni, vedi Statistiche.

Chiave primaria, chiave esterna e chiave univoca

Per Warehouse, i vincoli PRIMARY KEY e UNIQUE sono supportati solo quando vengono usati entrambi NONCLUSTERED e NOT ENFORCED.

FOREIGN KEY è supportato solo quando viene usato NOT ENFORCED.

Allineare i dati di origine con il data warehouse

Le tabelle di Warehouse vengono popolate caricando i dati da un'altra origine dati. Per eseguire un caricamento corretto, il numero e i tipi di dati delle colonne nei dati di origine devono essere allineati con la definizione della tabella nel data warehouse.

Se i dati provengono da più archivi dati, è possibile trasferirli nel data warehouse e archiviarli in una tabella di integrazione. Dopo che i dati sono stati inseriti nella tabella di integrazione, è possibile sfruttare la potenza di Data Warehouse per eseguire operazioni di trasformazione. Dopo aver preparati i dati, è possibile inserirli nelle tabelle di produzione.

Limiti

Warehouse supporta molte delle funzionalità per tabelle offerte da altri database, ma non tutte.

Di seguito sono elencate alcune delle funzionalità per tabelle che non sono attualmente supportate.

  • Massimo 1024 colonne per tabella
  • Colonne calcolate
  • Viste indicizzate
  • Tabelle partizionate
  • Sequenza
  • Colonne di tipo sparse
  • Chiavi surrogate nelle sequenze numeriche con colonne Identity
  • Sinonimi
  • Tabelle temporanee
  • Trigger
  • Indici univoci
  • Tipi definiti dall'utente

Importante

Esistono limitazioni per l'aggiunta di vincoli di tabella o colonne quando si usa il controllo del codice sorgente con Warehouse.