Εισαγωγή

Ολοκληρώθηκε

Η δημιουργία ενός μεγάλου σημασιολογικού μοντέλου είναι μία από τις πιο σημαντικές εργασίες που μπορεί να εκτελέσει ένας αναλυτής δεδομένων στο Microsoft Power BI. Εκτελώντας την εργασία αυτή σωστά, θα βοηθήσετε άλλους να κατανοήσουν τα δεδομένα σας, το οποίο θα κάνει τη δημιουργία πολύτιμων αναφορών Power BI ευκολότερη για εκείνους και για εσάς.

Οι σελίδες σε αυτή την εκπαιδευτική ενότητα είναι μόνο εκπαιδευτικές, δεν παρέχονται αρχεία δεδομένων. Έχετε την ευκαιρία να εργαστείτε με πραγματικά δεδομένα στα εργαστήρια.

Ένα καλό μοντέλο σημασιολογίας προσφέρει τα εξής πλεονεκτήματα:

  • Η εξερεύνηση δεδομένων είναι ταχύτερη.

  • Η δημιουργία συναθροίσεων είναι απλούστερη.

  • Οι αναφορές είναι πιο ακριβείς.

  • Η σύνταξη αναφορών απαιτεί λιγότερο χρόνο.

  • Η μελλοντική διατήρηση των αναφορών είναι ευκολότερη.

Η παροχή καθορισμένων κανόνων για ό,τι δημιουργεί ένα καλό μοντέλο σημασιολογίας είναι δύσκολη καθώς όλα τα δεδομένα διαφέρουν και η χρήση αυτών των δεδομένων ποικίλλει. Γενικά, ένα μικρότερο σημασιολογικό μοντέλο είναι καλύτερο καθώς εκτελείται ταχύτερα και θα είναι απλούστερο στη χρήση. Ωστόσο, ο ορισμός ενός μικρότερου σημασιολογικού μοντέλου είναι εξίσου προβληματικός καθώς πρόκειται για μια ευρετική και υποκειμενική έννοια.

Συνήθως, ένα μικρότερο σημασιολογικό μοντέλο αποτελείται από λιγότερους πίνακες και λιγότερες στήλες σε κάθε πίνακα που μπορεί να δει ο χρήστης. Εάν εισάγετε όλους τους απαραίτητους πίνακες από μια βάση δεδομένων πωλήσεων, όμως το συνολικό πλήθος πινάκων είναι 30 πίνακες, ο χρήστης δεν θα το βρει αυτό έξυπνο. Η σύμπτυξη αυτών των πινάκων σε πέντε πίνακες καθιστά το μοντέλο σημασιολογίας πιο εύχρηστο για τον χρήστη, ενώ εάν ο χρήστης ανοίξει έναν πίνακα και βρει 100 στήλες, μπορεί να τον απογοητεύσει. Η κατάργηση περιττών στηλών για την παροχή ενός πιο διαχειρίσιμου αριθμού αυξάνει την πιθανότητα ο χρήστης να διαβάσει όλα τα ονόματα στηλών. Για να συνοψίσουμε, θα πρέπει να στοχεύετε για απλότητα κατά τη σχεδίαση των σημασιολογικών μοντέλων σας.

Η παρακάτω εικόνα είναι ένα παράδειγμα σημασιολογικού μοντέλου. Τα πλαίσια περιέχουν πίνακες δεδομένων, όπου κάθε στοιχείο γραμμής στο πλαίσιο είναι μια στήλη. Οι γραμμές που συνδέουν τα πλαίσια αντιπροσωπεύουν σχέσεις μεταξύ των πινάκων. Αυτές οι σχέσεις μπορεί να είναι σύνθετες, ακόμη και σε ένα τέτοιο απλό μοντέλο. Το μοντέλο σημασιολογίας μπορεί να αποδιοργανωθεί εύκολα και το συνολικό πλήθος πινάκων στο μοντέλο μπορεί να αυξηθεί σταδιακά. Η διατήρηση του σημασιολογικού μοντέλου σας απλής, ολοκληρωμένης και ακριβούς απαιτεί συνεχή προσπάθεια.

Οι σχέσεις ορίζονται μεταξύ πινάκων μέσω πρωτευόντων και εξωτερικών κλειδιών. Τα πρωτεύοντα κλειδιά είναι στήλες που αναγνωρίζουν κάθε μοναδική, μη null γραμμή δεδομένων. Για παράδειγμα, εάν έχετε έναν πίνακα Customers, μπορεί να έχετε ένα ευρετήριο που αναγνωρίζει κάθε μοναδικό πελάτη. Η πρώτη γραμμή έχει αναγνωριστικό 1, η δεύτερη γραμμή αναγνωριστικό 2 και ούτω καθεξής. Σε κάθε γραμμή ανατίθεται μια μοναδική τιμή, η οποία μπορεί να αναφέρεται από αυτήν την απλή τιμή: το πρωτεύον κλειδί. Αυτή η διαδικασία είναι σημαντική όταν αναφέρετε γραμμές σε έναν διαφορετικό πίνακα, το οποίο είναι αυτό που κάνουν τα εξωτερικά κλειδιά. Οι σχέσεις μεταξύ πινάκων σχηματίζονται όταν έχετε κοινά πρωτεύοντα και εξωτερικά κλειδιά μεταξύ διαφορετικών πινάκων.

Το Power BI επιτρέπει τη δημιουργία σχέσεων από πίνακες με διαφορετικές προελεύσεις δεδομένων, μια πανίσχυρη συνάρτηση που σας επιτρέπει να αντλείτε έναν πίνακα από το Microsoft Excel και μια άλλη από μια σχεσιακή βάση δεδομένων. Στη συνέχεια, θα δημιουργήσετε τη σχέση μεταξύ αυτών των δύο πινάκων και θα τους αντιμετωπίσετε ως ένα ενοποιημένο σημασιολογικό μοντέλο.

Τώρα που μάθατε για τις σχέσεις που απαρτίζουν το σχήμα δεδομένων, μπορείτε να εξερευνήσετε έναν συγκεκριμένο τύπο σχεδίασης σχήματος, το αστεροειδές σχήμα, το οποίο έχει βελτιστοποιηθεί για υψηλές επιδόσεις και χρηστικότητα.

Αστεροειδή σχήματα

Μπορείτε να σχεδιάσετε ένα αστεροειδές σχήμα για να απλοποιήσετε τα δεδομένα σας. Δεν είναι ο μοναδικός τρόπος απλοποίησης των δεδομένων σας, όμως είναι μια δημοφιλής μέθοδος, επομένως κάθε αναλυτής δεδομένων Power BI θα πρέπει να τον κατανοεί. Σε ένα αστεροειδές σχήμα, κάθε πίνακας στο μοντέλο σημασιολογίας σας ορίζεται ως πίνακας διαστάσεων ή δεδομένων, όπως φαίνεται στην παρακάτω απεικόνιση.

Οι πίνακες δεδομένων περιέχουν τιμές δεδομένων από παρατήρηση ή συμβάντων: παραγγελίες πωλήσεων, πλήθος προϊόντων, τιμές, ημερομηνίες και ώρες συναλλαγών, και ποσότητες. Οι πίνακες δεδομένων μπορεί να περιέχουν πολλές επαναλαμβανόμενες τιμές. Για παράδειγμα, ένα προϊόν μπορεί να εμφανίζεται πολλές φορές σε πολλές γραμμές, για διαφορετικούς πελάτες σε διαφορετικές ημερομηνίες. Αυτές οι τιμές μπορεί να συγκεντρωθούν για να δημιουργηθούν απεικονίσεις. Για παράδειγμα, μια απεικόνιση των συνολικών παραγγελιών πωλήσεων αποτελεί μια συνάθροιση όλων των παραγγελιών πωλήσεων σε έναν πίνακα δεδομένων. Με τους πίνακες δεδομένων, είναι σύνηθες να βλέπετε στήλες συμπληρωμένες με αριθμούς και ημερομηνίες. Οι αριθμοί μπορεί να είναι μονάδες μέτρησης, όπως ποσό πωλήσεων ή μπορεί να είναι κλειδιά, όπως το αναγνωριστικό πελάτη. Οι ημερομηνίες αντιπροσωπεύουν τον χρόνο που καταγράφεται, όπως ημερομηνία παραγγελίας ή αποστολής.

Οι πίνακες διαστάσεων περιέχουν τις λεπτομέρειες σχετικά με τα δεδομένα στους πίνακες δεδομένων: προϊόντα, τοποθεσίες, υπάλληλοι και τύποι παραγγελιών. Αυτοί οι πίνακες συνδέονται στον πίνακα δεδομένων μέσω των στηλών κλειδιού. Οι πίνακες διαστάσεων χρησιμοποιούνται για το φιλτράρισμα και την ομαδοποίηση των δεδομένων σε πίνακες δεδομένων. Οι πίνακες δεδομένων, από την άλλη πλευρά, περιέχουν τα μετρήσιμα δεδομένα, όπως πωλήσεις και έσοδα, και κάθε γραμμή αντιπροσωπεύει έναν μοναδικό συνδυασμό τιμών από τους πίνακες διαστάσεων. Για την απεικόνιση συνολικών παραγγελιών πωλήσεων, μπορείτε να ομαδοποιήσετε τα δεδομένα ώστε να βλέπετε τις συνολικές παραγγελίες πωλήσεων κατά προϊόν, όπου το προϊόν είναι δεδομένα στον πίνακα διαστάσεων.

Οι πίνακες δεδομένων είναι πολύ μεγαλύτεροι από τους πίνακες διαστάσεων, επειδή προκύπτουν πολλά συμβάντα σε πίνακες δεδομένων, όπως μεμονωμένες πωλήσεις. Οι πίνακες διαστάσεων είναι συνήθως μικρότεροι καθώς σας περιορίζει ο αριθμός των στοιχείων που μπορείτε να φιλτράρετε και ομαδοποιήσετε. Για παράδειγμα, ένα έτος περιέχει μόνο τόσους μήνες και οι Ηνωμένες Πολιτείες αποτελούνται μόνο από έναν συγκεκριμένο αριθμό πολιτειών.

Εξετάζοντας τις πληροφορίες αυτές για τους πίνακες δεδομένων και διαστάσεων, μπορεί να αναρωτηθείτε πώς μπορείτε να δημιουργήσετε αυτήν την απεικόνιση στο Power BI.

Τα σχετικά δεδομένα βρίσκονται σε δύο πίνακες, Employee και Sales, όπως φαίνεται στο παρακάτω μοντέλο σημασιολογίας. Καθώς ο πίνακας Sales περιέχει τις τιμές παραγγελίας πωλήσεων, οι οποίες μπορούν να συγκεντρωθούν, θεωρείται πίνακας δεδομένων. Ο πίνακας Employee περιέχει το συγκεκριμένο όνομα υπαλλήλου, το οποίο φιλτράρει τις παραγγελίες πωλήσεων, συνεπώς θα είναι ένας πίνακας διαστάσεων. Η κοινή στήλη μεταξύ των δύο πινάκων, η οποία είναι το πρωτεύον κλειδί στον πίνακα Employee, είναι η EmployeeID, έτσι μπορείτε να ορίσετε μια σχέση μεταξύ των δύο πινάκων με βάση αυτήν τη στήλη.

Όταν δημιουργείτε αυτήν τη σχέση, μπορείτε να δημιουργήσετε την απεικόνιση σύμφωνα με τις απαιτήσεις, όπως φαίνεται στην παρακάτω εικόνα. Εάν δεν ορίσατε αυτήν τη σχέση, χωρίς να ξεχνάτε την ομοιότητα μεταξύ των δύο πινάκων, η δημιουργία της απεικόνισής σας θα ήταν πολύ πιο δύσκολη.

Τα αστεροειδή σχήματα και το υποκείμενο σημασιολογικό μοντέλο αποτελούν τη βάση των οργανωμένων αναφορών. όσο περισσότερο χρόνο αφιερώνετε στη δημιουργία αυτών των συνδέσεων και τη σχεδίαση, τόσο πιο εύκολο θα είναι να δημιουργήσετε και να διατηρήσετε αναφορές.