Μοντελοποίηση διαστάσεων στην Αποθήκη Microsoft Fabric
Ισχύει για:✅ Τελικό σημείο ανάλυσης SQL και Αποθήκη στο Microsoft Fabric
Αυτό το άρθρο είναι το πρώτο από μια σειρά σχετικά με τη διαστατική μοντελοποίηση μέσα σε μια αποθήκη. Παρέχει πρακτικές οδηγίες για την Warehouse στο Microsoft Fabric, η οποία είναι μια εμπειρία που υποστηρίζει πολλές δυνατότητες T-SQL, όπως η δημιουργία πινάκων και η διαχείριση δεδομένων σε πίνακες. Επομένως, έχετε τον πλήρη έλεγχο της δημιουργίας πινάκων μοντέλων διαστάσεων και της φόρτωσής τους με δεδομένα.
Σημείωμα
Σε αυτό το άρθρο, ο όρος αποθήκη δεδομένων αναφέρεται σε μια εταιρική αποθήκη δεδομένων, η οποία παρέχει ολοκληρωμένη ενοποίηση κρίσιμων δεδομένων σε ολόκληρο τον οργανισμό. Αντίθετα, η μεμονωμένη αποθήκη όρων αναφέρεται σε μια Αποθήκη Fabric, η οποία είναι μια προσφορά σχεσιακής βάσης δεδομένων λογισμικού ως υπηρεσίας (SaaS), την οποία μπορείτε να χρησιμοποιήσετε για να υλοποιήσετε μια αποθήκη δεδομένων. Για λόγους σαφήνειας, σε αυτό το άρθρο το τελευταίο αναφέρεται ως Fabric Warehouse.
Φιλοδώρημα
Εάν δεν είστε έμπειροι όσον αφορά τη μοντελοποίηση διαστάσεων, θεωρήστε ότι αυτή η σειρά άρθρων είναι το πρώτο σας βήμα. Δεν προορίζεται για να παρέχει μια πλήρη συζήτηση σχετικά με τη σχεδίαση μοντελοποίησης διαστάσεων. Για περισσότερες πληροφορίες, ανατρέξτε απευθείας σε ευρέως δημοσιευμένο περιεχόμενο, όπως το Κιτ εργαλείων αποθήκης δεδομένων: Ο απόλυτος οδηγός για τη μοντελοποίηση διαστάσεων (3η έκδοση, 2013) του Ralph Kimball και άλλους.
Σχεδίαση αστεροειδούς σχήματος
Το αστεροειδές σχήμα είναι μια τεχνική σχεδίασης μοντελοποίησης διαστάσεων που υιοθετήθηκε από αποθήκες σχεσιακών δεδομένων. Είναι μια συνιστώμενη προσέγγιση σχεδίασης που πρέπει να λάβετε κατά τη δημιουργία μιας Αποθήκης Fabric. Ένα αστεροειδές σχήμα αποτελείται από πίνακες δεδομένων και πίνακες διαστάσεων.
- Οι πίνακες διαστάσεων περιγράφουν τις οντότητες που σχετίζονται με τον οργανισμό σας και τις απαιτήσεις ανάλυσης. Γενικά, αντιπροσωπεύουν τα πράγματα που μοντελοποιείτε. Μπορεί να είναι προϊόντα, άτομα, τοποθεσίες ή οποιαδήποτε άλλη έννοια, όπως ημερομηνία και ώρα. Για περισσότερες πληροφορίες και βέλτιστες πρακτικές σχεδίασης, ανατρέξτε στο θέμα Πίνακες διαστάσεων σε αυτήν τη σειρά.
- Οι πίνακες δεδομένων αποθηκεύουν μετρήσεις που σχετίζονται με παρατηρήσεις ή συμβάντα. Μπορούν να αποθηκεύουν παραγγελίες πωλήσεων, υπόλοιπα αποθέματος, συναλλαγματικές ισοτιμίες, ενδείξεις θερμοκρασίας και πολλά άλλα. Οι πίνακες δεδομένων περιέχουν κλειδιά διαστάσεων μαζί με λεπτομερείς τιμές που μπορούν να συγκεντρωθούν. Για περισσότερες πληροφορίες και βέλτιστες πρακτικές σχεδίασης, ανατρέξτε στην ενότητα Πίνακες δεδομένων σε αυτήν τη σειρά.
Μια σχεδίαση αστεροειδούς σχήματος βελτιστοποιείται για φόρτους εργασίας ερωτημάτων ανάλυσης. Για αυτόν τον λόγο, θεωρείται προϋπόθεση για τα εταιρικά σημασιολογικά μοντέλα Power BI. Τα ερωτήματα ανάλυσης αφορούν το φιλτράρισμα, την ομαδοποίηση, την ταξινόμηση και τη σύνοψη δεδομένων. Τα δεδομένα δεδομένων συνοψίζονται στο περιβάλλον φίλτρων και ομαδοποιήσεων των σχετικών πινάκων διαστάσεων.
Ο λόγος για τον οποίο ονομάζεται αστεροειδές σχήμα είναι επειδή ένας πίνακας δεδομένων σχηματίζει το κέντρο ενός αστεριού, ενώ οι σχετικοί πίνακες διαστάσεων σχηματίζουν τα σημεία του αστεριού.
Ένα αστεροειδές σχήμα συχνά περιέχει πολλούς πίνακες δεδομένων και, επομένως, πολλά αστέρια.
Ένα καλά σχεδιασμένο αστεροειδές σχήμα παρέχει ερωτήματα υψηλής απόδοσης (σχεσιακά) λόγω λιγότερων συνδέσεων πίνακα και της υψηλότερης πιθανότητας χρήσιμων ευρετηρίων. Επίσης, ένα αστεροειδές σχήμα συχνά απαιτεί χαμηλή συντήρηση καθώς εξελίσσεται η σχεδίαση της αποθήκης δεδομένων. Για παράδειγμα, η προσθήκη μιας νέας στήλης σε έναν πίνακα διαστάσεων για την υποστήριξη της ανάλυσης από ένα νέο χαρακτηριστικό είναι μια σχετικά απλή εργασία για εκτέλεση. Όπως και η προσθήκη νέων στοιχείων και διαστάσεων καθώς η εμβέλεια της αποθήκης δεδομένων εξελίσσεται.
Περιοδικά, ίσως καθημερινά, οι πίνακες σε ένα διαστατικό μοντέλο ενημερώνονται και φορτώνονται με μια διαδικασία Εξαγωγή, Μετασχηματισμός και Φόρτωση (ETL). Αυτή η διαδικασία συγχρονίζει τα δεδομένα της με τα συστήματα προέλευσης, τα οποία αποθηκεύουν λειτουργικά δεδομένα. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Φόρτωση πινάκων σε αυτήν τη σειρά.
Μοντελοποίηση διαστάσεων για το Power BI
Για εταιρικές λύσεις, ένα διαστατικό μοντέλο σε μια Αποθήκη Fabric είναι μια συνιστώμενη προϋπόθεση για τη δημιουργία ενός μοντέλου σημασιολογίας Power BI. Το μοντέλο διαστάσεων όχι μόνο υποστηρίζει το σημασιολογικό μοντέλο, αλλά αποτελεί επίσης προέλευση δεδομένων για άλλες εμπειρίες, όπως τα μοντέλα εκμάθησης μηχανής.
Ωστόσο, σε συγκεκριμένες περιπτώσεις μπορεί να μην είναι η καλύτερη προσέγγιση. Για παράδειγμα, οι αναλυτές αυτοεξυπηρέτησης που χρειάζονται ελευθερία και ευελιξία για να ενεργούν γρήγορα και χωρίς εξάρτηση από το ΙΤ, μπορεί να δημιουργήσουν σημασιολογικά μοντέλα που συνδέονται απευθείας με τα δεδομένα προέλευσης. Σε αυτές τις περιπτώσεις, η θεωρία της διαστατικής μοντελοποίησης εξακολουθεί να είναι σχετική. Αυτή η θεωρία βοηθά τους αναλυτές να δημιουργούν εύχρηστα και αποτελεσματικά μοντέλα, αποφεύγοντας ταυτόχρονα την ανάγκη δημιουργίας και φόρτωσης ενός μοντέλου διαστάσεων σε μια αποθήκη δεδομένων. Αντί για αυτό, ένα οιονεί διαστατικό μοντέλο μπορεί να δημιουργηθεί χρησιμοποιώντας το Power Query, το οποίο ορίζει τη λογική σύνδεσης και μετασχηματισμού δεδομένων προέλευσης για τη δημιουργία και φόρτωση των πινάκων σημασιολογικών μοντέλων. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Κατανόηση του αστεροειδούς σχήματος και της σημασίας του για το Power BI.
Σημαντικό
Όταν χρησιμοποιείτε το Power Query για να ορίσετε ένα διαστατικό μοντέλο στο σημασιολογικό μοντέλο, δεν μπορείτε να διαχειριστείτε αλλαγές ιστορικού, οι οποίες μπορεί να είναι απαραίτητες για την ακριβή ανάλυση του παρελθόντος. Εάν αυτό είναι απαίτηση, θα πρέπει να δημιουργήσετε μια αποθήκη δεδομένων και να επιτρέψετε περιοδικές διαδικασίες ETL για την καταγραφή και την κατάλληλη αποθήκευση αλλαγών διάστασης.
Σχεδιασμός για μια αποθήκη δεδομένων
Θα πρέπει να προσεγγίσετε τη δημιουργία μιας αποθήκης δεδομένων και τη σχεδίαση ενός μοντέλου διάστασης ως μια σοβαρή και σημαντική επιχείρηση. Αυτό συμβαίνει επειδή η αποθήκη δεδομένων αποτελεί βασικό στοιχείο της πλατφόρμας δεδομένων σας. Θα πρέπει να αποτελέσει μια στέρεα βάση που υποστηρίζει την ανάλυση και την αναφορά, και επομένως τη λήψη αποφάσεων, για ολόκληρο τον οργανισμό σας.
Για τον σκοπό αυτό, η αποθήκη δεδομένων σας θα πρέπει να προσπαθήσει να αποθηκεύσει ποιοτικά, συμβατά και ιστορικά ακριβή δεδομένα ως μία μόνο έκδοση της αλήθειας. Θα πρέπει να παρέχει κατανοητά και navigable δεδομένα με γρήγορες επιδόσεις και να επιβάλλει δικαιώματα, έτσι ώστε τα σωστά δεδομένα να μπορούν να προσπελαστούν μόνο από τα κατάλληλα άτομα. Προσπαθήστε να σχεδιάσετε την αποθήκη δεδομένων σας για ανθεκτικότητα, επιτρέποντάς της να προσαρμόζεται για να αλλάζει καθώς εξελίσσονται οι απαιτήσεις σας.
Η επιτυχημένη υλοποίηση μιας αποθήκης δεδομένων εξαρτάται από τον καλό σχεδιασμό. Για πληροφορίες σχετικά με στρατηγικά και τακτικά ζητήματα, καθώς και στοιχεία δράσης που οδηγούν στην επιτυχή υιοθέτηση του Fabric και της αποθήκης δεδομένων σας, ανατρέξτε στο χάρτη υιοθέτησης του Microsoft Fabric.
Φιλοδώρημα
Συνιστούμε να δημιουργήσετε επαναληπτικά την εταιρική αποθήκη δεδομένων σας. Ξεκινήστε με τις πιο σημαντικές θεματικές περιοχές πρώτα και, στη συνέχεια, με την πάροδο του χρόνου, σύμφωνα με την προτεραιότητα και τους πόρους, επεκτείνετε την αποθήκη δεδομένων με άλλες περιοχές θέματος.
Σχετικό περιεχόμενο
Στο επόμενο άρθρο αυτής της σειράς, μάθετε σχετικά με τις οδηγίες και τις βέλτιστες πρακτικές σχεδίασης για πίνακες διαστάσεων.