Modellazione dimensionale nel magazzino di Microsoft Fabric
Si applica a:✅ endpoint di Analisi SQL e Warehouse in Microsoft Fabric
Questo articolo è il primo di una serie sulla modellazione dimensionale all'interno di un magazzino. Fornisce una guida pratica per Warehouse in Microsoft Fabric, un'esperienza che supporta molte funzionalità T-SQL, come la creazione di tabelle e la gestione dei dati nelle tabelle. Si ha, quindi, il pieno controllo sulla creazione delle tabelle del modello dimensionale e sul caricamento dei dati.
Nota
In questo articolo il termine data warehouse si riferisce a un data warehouse aziendale, che fornisce un'integrazione completa dei dati critici nell'organizzazione. Al contrario, il termine warehouse da solo si riferisce a un Fabric Warehouse, ovvero un database relazionale SaaS (Software as a Service) che è possibile usare per implementare un data warehouse. Per maggiore chiarezza, in questo articolo verrà usato il termine Fabric Warehouse.
Suggerimento
Se si è inesperti con la modellazione dimensionale, prendere in considerazione che questa serie di articoli è un primo passo. Non è pensato per fornire una discussione completa sulla progettazione di modellazione dimensionale. Per altre informazioni, si può fare riferimento direttamente a pubblicazioni ampiamente riconosciute, ad esempio The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling (terza edizione, 2013) di Ralph Kimball e altri.
Progettazione dello schema star
Schema star è una tecnica di progettazione di modellazione dimensionale ampiamente adottata da data warehouse relazionali. È un approccio alla progettazione consigliato quando si crea un magazzino di Fabric. Uno schema star comprende tabelle dei fatti e tabelle delle dimensioni.
- Le tabelle delle dimensioni descrivono le entità rilevanti per i requisiti dell'organizzazione e dell'analisi. In generale, rappresentano gli elementi modellati. Gli elementi possono essere prodotti, persone, luoghi o qualsiasi altro concetto, tra cui data e ora. Per altre informazioni e procedure consigliate per la progettazione, vedere tabelle delle dimensioni in questa serie.
- Le tabelle dei fatti archiviano le misurazioni associate a osservazioni o eventi. Possono archiviare ordini di vendita, saldi azionari, tassi di cambio, letture della temperatura e altro ancora. Le tabelle dei fatti contengono chiavi di dimensione insieme a valori granulari che possono essere aggregati. Per altre informazioni e procedure consigliate per la progettazione, vedere tabelle dei fatti in questa serie.
Una progettazione dello schema star è ottimizzata per i carichi di lavoro di query analitiche. Per questo motivo, è considerato un prerequisito per i modelli semantici aziendali di Power BI. Le query analitiche riguardano il filtro, il raggruppamento, l'ordinamento e il riepilogo dei dati. I dati dei fatti vengono riepilogati nel contesto dei filtri e dei raggruppamenti delle tabelle delle dimensioni correlate.
Il motivo per cui viene chiamato schema star è dovuto al fatto che una tabella dei fatti costituisce il centro di una stella mentre le tabelle delle dimensioni correlate formano i punti della stella.
Uno schema star spesso contiene più tabelle dei fatti e quindi più stelle.
Uno schema star ben progettato offre query a prestazioni elevate (relazionali) a causa di un minor numero di join di tabelle e maggiore probabilità di indici utili. Inoltre, uno schema star richiede spesso una manutenzione ridotta man mano che la progettazione del data warehouse si evolve. Ad esempio, l'aggiunta di una nuova colonna a una tabella delle dimensioni per supportare l'analisi da un nuovo attributo è un'attività relativamente semplice da eseguire. Man mano che si aggiungono nuovi fatti e dimensioni, l'ambito del data warehouse si evolve.
Periodicamente, forse ogni giorno, le tabelle in un modello dimensionale vengono aggiornate e caricate da un processo Extract, Transform e Load (ETL). Questo processo sincronizza i dati con i sistemi di origine, che archivia i dati operativi. Per ulteriori informazioni, vedere caricare tabelle in questa serie.
Modellazione dimensionale per Power BI
Per le soluzioni aziendali, un modello dimensionale in un'istanza di magazzino di Fabric è un prerequisito consigliato per la creazione di un modello semantico di Power BI. Non solo il modello dimensionale supporta il modello semantico, ma è anche un'origine di dati per altre esperienze, ad esempio i modelli di Machine Learning.
Tuttavia, in circostanze specifiche potrebbe non essere l'approccio migliore. Ad esempio, gli analisti self-service che necessitano di libertà e agilità per agire rapidamente e senza dipendenze dall'IT, potrebbero creare modelli semantici che si connettono direttamente ai dati di origine. In questi casi, la teoria della modellazione dimensionale è ancora rilevante. Questa teoria aiuta gli analisti a creare modelli intuitivi ed efficienti, evitando la necessità di creare e caricare un modello dimensionale in un data warehouse. È invece possibile creare un modello quasi dimensionale usando Power Query, che definisce la logica a cui connettersi e trasforma i dati di origine per creare e caricare le tabelle del modello semantico. Per altre informazioni, vedere Informazioni su uno schema star e sull'importanza di questo schema per Power BI.
Importante
Quando si usa Power Query per definire un modello dimensionale nel modello semantico, non è possibile gestire le modifiche cronologiche, che potrebbe essere necessaria per analizzare accuratamente il passato. Se si tratta di un requisito, è necessario creare un data warehouse e consentire ai processi ETL periodici di acquisire e archiviare in modo appropriato le modifiche delle dimensioni.
Pianificazione di un data warehouse
È consigliabile affrontare la creazione di un data warehouse e la progettazione di un modello di dimensione come un'impresa seria e importante. Questo perché il data warehouse è un componente fondamentale di una piattaforma dati. Deve costituire una solida base che supporti l'analisi e la creazione di report, e quindi il processo decisionale, per l'intera organizzazione.
A questo scopo, il data warehouse deve cercare di archiviare dati di qualità, conformi e storicamente accurati come singola versione della verità. Deve fornire dati comprensibili e navigabili con prestazioni veloci e applicare autorizzazioni in modo che i dati corretti possano essere accessibili solo dalle persone giuste. È necessario progettare il data warehouse per la resilienza, consentendogli di adattarsi al cambiamento man mano che i requisiti si evolvono.
L'implementazione corretta di un data warehouse dipende da una buona pianificazione. Per informazioni sulle considerazioni strategiche e tattiche e sugli elementi di azione che portano all'adozione corretta di Fabric e del data warehouse, vedere la roadmap per l'adozione di Microsoft Fabric.
Suggerimento
È consigliabile creare il data warehouse aziendale in modo iterativo. Iniziare prima con le aree di interesse più importanti e quindi nel corso del tempo, in base alla priorità e alle risorse, estendere il data warehouse con altre aree di interesse.
Contenuto correlato
Nell'articolo successivo di questa serie vengono fornite informazioni sulle linee guida e sulle procedure consigliate per la progettazione delle tabelle delle dimensioni.