Μείωση πληθικότητας

Ολοκληρώθηκε

Η πληθικότητα είναι ένας όρος που χρησιμοποιείται για την περιγραφή της μοναδικότητας των τιμών σε μια στήλη. Η πληθικότητα χρησιμοποιείται επίσης στο πλαίσιο των σχέσεων μεταξύ δύο πινάκων, όπου περιγράφει την κατεύθυνση της σχέσης.

Αναγνώριση επιπέδων πληθικότητας σε στήλες

Στο παρελθόν, όταν χρησιμοποιούσατε το πρόγραμμα επεξεργασίας Power Query για να αναλύσετε τα μετα-δεδομένα, η επιλογή Διανομή στηλών στην καρτέλα Προβολή παρουσίασε στατιστικά στοιχεία για τον αριθμό των διακριτών και μοναδικών στοιχείων σε κάθε στήλη στα δεδομένα.

  • Πλήθος διακριτών τιμών - Ο συνολικός αριθμός διαφορετικών τιμών που βρέθηκαν σε μια δεδομένα στήλη.

  • Πλήθος μοναδικών τιμών - Ο συνολικός αριθμός τιμών που εμφανίζονται μόνο μία φορά σε μια δεδομένη στήλη.

Μια στήλη που διαθέτει πολλές επαναλαμβανόμενες τιμές στην περιοχή της (μοναδικό πλήθος χαμηλό) θα έχει χαμηλό επίπεδο πληθικότητας. Αντιστρόφως, μια στήλη με πολλές μοναδικές τιμές στην περιοχή της (μοναδικό πλήθος υψηλό) θα έχει υψηλό επίπεδο πληθικότητας.

Χαμηλότερη πληθικότητα οδηγεί σε πιο βελτιστοποιημένες επιδόσεις, επομένως μπορεί να χρειαστεί να μειώσετε τον αριθμό των στηλών υψηλής πληθικότητας στο μοντέλο σημασιολογίας σας.

Μείωση πληθικότητας σχέσης

Όταν εισαγάγετε πολλούς πίνακες, είναι δυνατό να κάνετε ορισμένη ανάλυση χρησιμοποιώντας δεδομένα από όλους αυτούς τους πίνακες. Οι σχέσεις μεταξύ των πινάκων αυτών είναι απαραίτητες για τον ακριβή υπολογισμό αποτελεσμάτων και την εμφάνιση των σωστών πληροφοριών στις αναφορές σας. Το Power BI Desktop διευκολύνει τη δημιουργία αυτών των σχέσεων. Στην πραγματικότητα, στις περισσότερες περιπτώσεις, δεν θα χρειαστεί να κάνετε τίποτα καθώς το κάνει για λογαριασμό σας η δυνατότητα αυτόματου εντοπισμού. Ωστόσο, μπορεί περιστασιακά να χρειαστεί να δημιουργείτε σχέσεις ή να πραγματοποιείτε αλλαγές σε μια σχέση. Παρ' όλα αυτά, είναι σημαντικό να κατανοήσετε τις σχέσεις στο Power BI Desktop και πώς τις δημιουργείτε και επεξεργάζεστε.

Όταν δημιουργείτε ή επεξεργάζεστε μια σχέση, μπορείτε να ρυθμίσετε πρόσθετες επιλογές. Από προεπιλογή, το Power BI Desktop ρυθμίζει αυτόματα πρόσθετες επιλογές με βάση καλύτερη εκτίμηση, το οποίο μπορεί να διαφέρει για κάθε σχέση με βάση τα δεδομένα στις στήλες.

Οι σχέσεις μπορεί να έχουν διαφορετική πληθικότητα. Η πληθικότητα είναι η κατεύθυνση της σχέσης και κάθε σχέση μοντέλου πρέπει να ορίζεται με έναν τύπο πληθικότητας. Οι επιλογές πληθικότητας στο Power BI είναι οι εξής:

  • Πολλά προς ένα (*:1) - Αυτή η σχέση είναι ο προεπιλεγμένος και πιο συνηθισμένος τύπος. Αυτό σημαίνει ότι η στήλη σε έναν πίνακα μπορεί να έχει περισσότερες από μία παρουσίες μιας τιμής και ο άλλος σχετικός πίνακας, γνωστός συχνά ως πίνακας αναζήτησης, διαθέτει μία μόνο παρουσία μιας τιμής.

  • Ένα προς ένα (1:1) - Σε αυτόν τον τύπο σχέσης, η στήλη σε έναν πίνακα έχει μόνο μία παρουσία μιας συγκεκριμένης τιμής και ο άλλος σχετικός πίνακας έχει μόνο μία παρουσία μιας συγκεκριμένης τιμής.

  • Ένα προς πολλά (1:*) - Σε αυτόν τον τύπο σχέσης, η στήλη σε έναν πίνακα έχει μόνο μία παρουσία μιας συγκεκριμένης τιμής και ο άλλος σχετικός πίνακας μπορεί να έχει περισσότερες από μία παρουσίες μιας τιμής.

  • Πολλά προς πολλά (:) - Με σύνθετα μοντέλα μπορείτε να ορίσετε μια σχέση πολλά προς πολλά μεταξύ πινάκων, η οποία καταργεί τις απαιτήσεις για μοναδικές τιμές σε πίνακες. Καταργεί επίσης προηγούμενες λύσεις, όπως την παρουσίαση νέων πινάκων αποκλειστικά για τον ορισμό σχέσεων.

Κατά τη διάρκεια της ανάπτυξης, δημιουργείτε και επεξεργάζεστε σχέσεις στο μοντέλο σας, επομένως, όταν δημιουργείτε νέες σχέσεις στο μοντέλο σας, ανεξάρτητα από την πληθικότητα που έχετε επιλέξει, να εξασφαλίζετε πάντα ότι αμφότερες οι στήλες που χρησιμοποιείτε για συμμετοχή σε μια σχέση μοιράζονται τον ίδιο τύπο δεδομένων. Το μοντέλο σας δεν θα λειτουργήσει ποτέ εάν επιχειρήσετε να δημιουργήσετε μια σχέση μεταξύ δύο στηλών, όπου μία στήλη διαθέτει έναν τύπο δεδομένων κειμένου και μια άλλη στήλη διαθέτει έναν τύπο δεδομένων ακεραίου.

Στο παρακάτω παράδειγμα, το πεδίο ProductID διαθέτει τον τύπο δεδομένων Ακέραιος αριθμός στους πίνακες "Προϊόν" και "Πωλήσεις". Οι στήλες με τύπο δεδομένων Ακέραιος έχουν καλύτερη απόδοση σε σχέση με στήλες με τύπο δεδομένων Κείμενο.

Βελτίωση επιδόσεων μειώνοντας τα επίπεδα πληθικότητας

Power BI Desktop προσφέρει διαφορετικές τεχνικές που μπορείτε να χρησιμοποιήσετε για να μειώσετε τα δεδομένα που φορτώνονται σε σημασιολογικά μοντέλα, όπως η σύνοψη. Η μείωση των δεδομένων που φορτώνονται στο μοντέλο σας θα βελτιώσει την πληθικότητα σχέσης της αναφοράς. Για αυτόν τον λόγο, είναι σημαντικό να προσπαθήσετε να ελαχιστοποιήσετε τα δεδομένα που θα φορτωθούν στα μοντέλα σας. Αυτή η περίπτωση ισχύει ιδιαίτερα για μεγάλα μοντέλα ή μοντέλα που αναμένετε ότι θα γίνουν μεγάλα με τον καιρό.

Ίσως η πιο αποτελεσματική τεχνική μείωσης του μεγέθους ενός μοντέλου είναι η χρήση ενός πίνακα σύνοψης από την προέλευση δεδομένων.  Όπου ένας αναλυτικός πίνακας μπορεί να περιέχει κάθε συναλλαγή, ένας πίνακας σύνοψης θα περιέχει μία εγγραφή ανά ημέρα, ανά εβδομάδα ή ανά μήνα. Μπορεί να είναι ο μέσος όρος όλων των συναλλαγών ανά ημέρα, για παράδειγμα.

Για παράδειγμα, ένας πίνακας γεγονότων πωλήσεων προέλευσης αποθηκεύει μία γραμμή για κάθε γραμμή παραγγελίας. Σημαντική μείωση των δεδομένων μπορεί να επιτευχθεί συνοψίζοντας όλα τα μετρικά πωλήσεων εάν ομαδοποιείτε κατά ημερομηνία, πελάτη και προϊόν, και δεν απαιτούνται λεπτομέρειες μεμονωμένων συναλλαγών.

Εξετάστε τότε ότι μια ακόμη μεγαλύτερη μείωση δεδομένων μπορεί να επιτευχθεί ομαδοποιώντας κατά ημερομηνία σε επίπεδο μήνα. Μπορεί να επιτύχει μια πιθανή μείωση κατά 99 τοις εκατό στο μέγεθος μοντέλου, όμως δεν θα είναι πλέον εφικτή η αναφορά σε επίπεδο ημέρας ή επίπεδο μεμονωμένης παραγγελίας. Η απόφαση σύνοψης των δεδομένων τύπου γεγονότος θα αφορά πάντα σε έναν συμβιβασμό με τη λεπτομέρεια των δεδομένων σας. Ένα μειονέκτημα είναι ότι μπορεί να χάσετε τη δυνατότητα λεπτομερούς έρευνας στα δεδομένα καθώς η λεπτομέρεια δεν υπάρχει πλέον.  Αυτός ο συμβιβασμός μπορεί να μετριαστεί χρησιμοποιώντας μια σχεδίαση μεικτού μοντέλου.

Στο Power BI Desktop, μια σχεδίαση μεικτής λειτουργίας παράγει ένα σύνθετο μοντέλο. Στην ουσία, σας επιτρέπει να προσδιορίσετε μια λειτουργία χώρου αποθήκευσης για κάθε πίνακα. Επομένως, κάθε πίνακας μπορεί να έχει τη δική του ιδιότητα Λειτουργία χώρου αποθήκευσης ορισμένη ως Εισαγωγή ή DirectQuery.

Μια αποτελεσματική τεχνική για να μειώσετε το μέγεθος μοντέλου είναι να ορίσετε την ιδιότητα Λειτουργία χώρου αποθήκευσης για μεγαλύτερους πίνακες τύπου γεγονότος σε DirectQuery. Αυτή η προσέγγιση σχεδίασης μπορεί να λειτουργήσει καλά σε συνδυασμό με τεχνικές που χρησιμοποιούνται για τη σύνοψη των δεδομένων σας. Για παράδειγμα, τα συνοπτικά δεδομένων πωλήσεων μπορούσαν να χρησιμοποιηθούν για επίτευξη υψηλής απόδοσης αναφοράς "σύνοψης". Μια λεπτομερής σελίδα μπορεί να δημιουργηθεί για να εμφανίζονται λεπτομερείς πωλήσεις για συγκεκριμένο (και περιορισμένο) περιβάλλον φιλτραρίσματος, που εμφανίζει όλες τις παραγγελίες πωλήσεων στο περιβάλλον. Η λεπτομερής σελίδα θα περιλαμβάνει απεικονίσεις με βάση έναν πίνακα DirectQuery για την ανάκτηση των δεδομένων παραγγελίας πωλήσεων (λεπτομέρειες παραγγελίας πωλήσεων).

Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Τεχνικές μείωσης δεδομένων για μοντελοποίηση εισαγωγής.