Ομαδοποίηση ή σύνοψη γραμμών
Στο Power Query, μπορείτε να ομαδοποιήσετε τιμές σε διάφορες γραμμές σε μία μόνο τιμή, ομαδοποιώντας τις γραμμές σύμφωνα με τις τιμές σε μία ή περισσότερες στήλες. Μπορείτε να επιλέξετε από δύο τύπους λειτουργιών ομαδοποίησης:
Ομαδοποιήσεις στηλών.
Ομαδοποιήσεις γραμμών.
Για αυτό το εκπαιδευτικό βοήθημα, χρησιμοποιείτε το ακόλουθο δείγμα πίνακα.
Στιγμιότυπο οθόνης ενός πίνακα με στήλες που εμφανίζουν Έτος (2020), Χώρα (ΗΠΑ, Παναμάς ή Καναδάς), Προϊόν (Πουκάμισο ή Σορτς), κανάλι πωλήσεων (Online ή Μεταπωλητής) και Μονάδες (διάφορες τιμές από 55 έως 7500)
Πού μπορείτε να βρείτε το κουμπί Ομαδοποίηση κατά
Μπορείτε να βρείτε το κουμπί Ομαδοποίηση κατά σε τρία σημεία:
Στην καρτέλα Αρχική, στην ομάδα Μετασχηματισμός.
Στην καρτέλα
Μετασχηματισμός , στην ομάδα πίνακας. Στο μενού συντόμευσης, όταν κάνετε δεξί κλικ για να επιλέξετε στήλες.
Χρήση συνάρτησης συγκεντρωτικών αποτελεσμάτων για ομαδοποίηση κατά μία ή περισσότερες στήλες
Σε αυτό το παράδειγμα, ο στόχος σας είναι να συνοψίσετε τις συνολικές μονάδες που πωλήθηκαν σε επίπεδο χώρας και καναλιού πωλήσεων. Χρησιμοποιείτε τις στήλες Country και καναλιού πωλήσεων για να εκτελέσετε τη λειτουργία "ομαδοποίηση κατά".
- Επιλέξτε Ομαδοποίηση κατά στην καρτέλα Αρχική.
- Επιλέξτε για προχωρημένους, ώστε να μπορείτε να επιλέξετε πολλές στήλες για ομαδοποίηση κατά.
- Επιλέξτε τη στήλη
Country. - Επιλέξτε Προσθήκη ομαδοποίησης.
- Επιλέξτε τη στήλη κανάλι πωλήσεων
. - Στο
Όνομα νέας στήλης , πληκτρολογήστε Σύνολο μονάδων , στοΛειτουργία, επιλέξτε Άθροισμα και, στηνΣτήλη , επιλέξτεUnits . - Επιλέξτε OK
Αυτή η λειτουργία σάς παρέχει τον παρακάτω πίνακα.
Διαθέσιμες λειτουργίες
Με τη δυνατότητα Ομαδοποίηση κατά, οι διαθέσιμες λειτουργίες μπορούν να κατηγοριοποιηθούν με δύο τρόπους:
- Λειτουργία σε επίπεδο γραμμών
- Λειτουργία επιπέδου στήλης
Ο παρακάτω πίνακας περιγράφει κάθε μία από αυτές τις λειτουργίες.
Όνομα λειτουργίας | Κατηγορία | Περιγραφή |
---|---|---|
αθροίσματος | Λειτουργία στήλης | Αθροίζει όλες τις τιμές από μια στήλη |
Μέσος όρος |
Λειτουργία στήλης | Υπολογίζει τη μέση τιμή από μια στήλη |
διάμεσος | Λειτουργία στήλης | Υπολογίζει τη διάμεσο από μια στήλη |
Min | Λειτουργία στήλης | Υπολογίζει την ελάχιστη τιμή από μια στήλη |
Μέγιστος αριθμός |
Λειτουργία στήλης | Υπολογίζει τη μέγιστη τιμή από μια στήλη |
Εκατοστημόριο | Λειτουργία στήλης | Υπολογίζει το εκατοστημόριο, χρησιμοποιώντας μια τιμή εισόδου από 0 έως 100, από μια στήλη |
πλήθος διακριτών τιμών | Λειτουργία στήλης | Υπολογίζει τον αριθμό διακριτών τιμών από μια στήλη |
πλήθος γραμμών | Λειτουργία γραμμής | Υπολογίζει τον συνολικό αριθμό γραμμών από μια δεδομένη ομάδα |
πλήθος διακριτών γραμμών | Λειτουργία γραμμής | Υπολογίζει τον αριθμό διακριτών γραμμών από μια δεδομένη ομάδα |
όλες οι γραμμές | Λειτουργία γραμμής | Εξάγει όλες τις ομαδοποιημένες γραμμές σε μια τιμή πίνακα χωρίς συναθροίσεις |
Σημείωση
Οι πλήθος διακριτών τιμών και λειτουργίες Εκατοστημορίου είναι διαθέσιμες μόνο στο Power Query Online.
Εκτέλεση μιας λειτουργίας για ομαδοποίηση κατά μία ή περισσότερες στήλες
Ξεκινώντας από το αρχικό δείγμα, σε αυτό το παράδειγμα δημιουργείτε μια στήλη που περιέχει τις συνολικές μονάδες και δύο άλλες στήλες που σας δίνουν το όνομα και τις μονάδες που πωλήθηκαν για το προϊόν με τις κορυφαίες επιδόσεις, που συνοψίζονται σε επίπεδο χώρας και καναλιού πωλήσεων.
Χρησιμοποιήστε τις ακόλουθες στήλες ως Ομαδοποίηση κατά στηλών:
- Χώρα
- Κανάλι πωλήσεων
Δημιουργήστε δύο νέες στήλες, ακολουθώντας τα εξής βήματα:
- Συγκεντρώστε τη στήλη
Units χρησιμοποιώντας τη λειτουργία Sum. Ονομάστε αυτήν τη στήλη Σύνολο μονάδων. - Προσθέστε μια νέα στήλη
Products χρησιμοποιώντας τη λειτουργίαΌλες οι γραμμές.
- Συγκεντρώστε τη στήλη
Αφού ολοκληρωθεί αυτή η λειτουργία, παρατηρήστε ότι η στήλη Products έχει τιμές [Table] μέσα σε κάθε κελί. Κάθε τιμή [Πίνακας] περιέχει όλες τις γραμμές που ομαδοποιήθηκαν σύμφωνα με τις στήλες Country και Sales Channel από τον αρχικό πίνακα. Μπορείτε να επιλέξετε τον κενό χώρο μέσα στο κελί για να δείτε μια προεπισκόπηση των περιεχομένων του πίνακα στο κάτω μέρος του παραθύρου διαλόγου.
Σημείωση
Το παράθυρο προεπισκόπησης λεπτομερειών ενδέχεται να μην εμφανίζει όλες τις γραμμές που χρησιμοποιήθηκαν για τη λειτουργία ομαδοποίησης. Μπορείτε να επιλέξετε την τιμή [Πίνακας] για να δείτε όλες τις γραμμές που σχετίζονται με την αντίστοιχη λειτουργία ομαδοποίησης.
Στη συνέχεια, πρέπει να εξαγάγετε τη γραμμή που έχει την υψηλότερη τιμή στη στήλη Units των πινάκων μέσα στη νέα στήλη Products και να καλέσετε αυτή τη νέα στήλη προϊόν Top performer.
Εξαγωγή των πληροφοριών προϊόντος με τον κορυφαίο ερμηνευτή
Με τη νέα στήλη
Ονομάστε τη νέα στήλη σας προϊόντων Top performer . Πληκτρολογήστε τον τύπο Table.Max([Products], "Units" )
στην περιοχή τύπος προσαρμοσμένης στήλης.
Το αποτέλεσμα αυτού του τύπου δημιουργεί μια νέα στήλη με τιμές [Εγγραφή]. Αυτές οι τιμές εγγραφής είναι ουσιαστικά ένας πίνακας με μία μόνο γραμμή. Αυτές οι εγγραφές περιέχουν τη γραμμή με τη μέγιστη τιμή για τη στήλη Units κάθε τιμής [Table] στη στήλη Products.
Με αυτό το νέο προϊόν top performer στήλη που περιέχει τιμές [Εγγραφή], μπορείτε να επιλέξετε το εικονίδιο ανάπτυξης, να επιλέξετε τα πεδία Product και Units και, στη συνέχεια, να επιλέξετε OK.
Αφού καταργήσετε τη στήλη Products και ορίσετε τον τύπο δεδομένων και για τις δύο στήλες που έχουν αναπτυχθεί πρόσφατα, το αποτέλεσμά σας θα μοιάζει με την παρακάτω εικόνα.
Ασαφής ομαδοποίηση
Σημείωση
Η παρακάτω δυνατότητα είναι διαθέσιμη μόνο στο Power Query Online.
Για να παρουσιάσετε πώς μπορείτε να κάνετε "ασαφή ομαδοποίηση", εξετάστε το δείγμα πίνακα που εμφανίζεται στην παρακάτω εικόνα.
Ο στόχος της ασαφής ομαδοποίησης είναι να εκτελέσει μια λειτουργία "ομαδοποίησης κατά", η οποία χρησιμοποιεί έναν αλγόριθμο κατά προσέγγιση αντιστοίχισης για συμβολοσειρές κειμένου. Το Power Query χρησιμοποιεί τον αλγόριθμο ομοιότητας Jaccard για τη μέτρηση της ομοιότητας μεταξύ ζευγών παρουσιών. Στη συνέχεια, εφαρμόζει συμπλέγματα συγκεντρωτικών ιεραρχικών συμπλεγμάτων σε παρουσίες ομάδας. Η παρακάτω εικόνα εμφανίζει την έξοδο που περιμένετε, όπου ο πίνακας ομαδοποιείται σύμφωνα με τη στήλη
Για να κάνετε την ασαφή ομαδοποίηση, εκτελέστε τα ίδια βήματα που περιγράφονται προηγουμένως σε αυτό το άρθρο. Η μόνη διαφορά είναι ότι αυτή τη φορά στο παράθυρο διαλόγου Ομαδοποίηση
Για κάθε ομάδα γραμμών, το Power Query επιλέγει την πιο συχνή παρουσία ως "κανονικό" παρουσία. Εάν προκύψουν πολλές παρουσίες με την ίδια συχνότητα, το Power Query επιλέγει την πρώτη. Αφού επιλέξετε
Ωστόσο, έχετε περισσότερο έλεγχο στη λειτουργία ασαφούς ομαδοποίησης αναπτύσσοντας επιλογές ασαφούς ομάδας.
Οι παρακάτω επιλογές είναι διαθέσιμες για ασαφή ομαδοποίηση:
- όριο ομοιότητας (προαιρετικό): Αυτή η επιλογή υποδεικνύει πώς πρέπει να ομαδοποιηθούν παρόμοιες δύο τιμές. Η ελάχιστη ρύθμιση μηδέν (0) προκαλεί την ομαδοποίηση όλων των τιμών. Η μέγιστη ρύθμιση του 1 επιτρέπει μόνο τις τιμές που συμφωνούν ακριβώς να ομαδοποιηθούν. Η προεπιλογή είναι 0,8.
- Παραβλέψτε τα πεζά-κεφαλαία: Όταν συγκρίνονται οι συμβολοσειρές κειμένου, τα πεζά-κεφαλαία παραβλέπονται. Αυτή η επιλογή είναι ενεργοποιημένη από προεπιλογή.
- Ομαδοποίηση συνδυάζοντας τμήματα κειμένου: Ο αλγόριθμος προσπαθεί να συνδυάσει τμήματα κειμένου (όπως να συνδυάσει Micro και soft στο Microsoft) για να ομαδοποιήσει τιμές.
- Εμφάνιση βαθμολογιών ομοιότητας: Εμφάνιση βαθμολογιών ομοιότητας μεταξύ των τιμών εισόδου και των υπολογιζόμενων αντιπροσωπευτικών τιμών μετά από ασαφή ομαδοποίηση. Απαιτεί την προσθήκη μιας λειτουργίας όπως Όλες οι γραμμές για την παρουσίαση αυτών των πληροφοριών σε επίπεδο γραμμής.
- πίνακας μετασχηματισμού (προαιρετικά): Μπορείτε να επιλέξετε έναν πίνακα μετασχηματισμού που αντιστοιχίζει τιμές (όπως αντιστοίχιση MSFT σε Microsoft) για να τις ομαδοποιήσετε.
Για αυτό το παράδειγμα, χρησιμοποιείται ένας πίνακας μετασχηματισμού για να δείξει πώς μπορούν να αντιστοιχιστούν τιμές. Ο πίνακας μετασχηματισμού έχει δύο στήλες:
- Από: Η συμβολοσειρά κειμένου που θα αναζητήσετε στον πίνακά σας.
- Προς: Η συμβολοσειρά κειμένου που θα χρησιμοποιηθεί για την αντικατάσταση της συμβολοσειράς κειμένου στη στήλη Από.
Η παρακάτω εικόνα εμφανίζει τον πίνακα μετασχηματισμού που χρησιμοποιείται σε αυτό το παράδειγμα.
Σημαντικός
Είναι σημαντικό ο πίνακας μετασχηματισμού να έχει τις ίδιες στήλες και ονόματα στηλών όπως φαίνεται στην προηγούμενη εικόνα (πρέπει να έχουν την ετικέτα "Από" και "Προς"). Διαφορετικά, το Power Query δεν αναγνωρίζει τον πίνακα ως πίνακα μετασχηματισμού.
Επιστρέψτε στο παράθυρο διαλόγου Ομαδοποίηση
Αφού επιλέξετε τον πίνακα μετασχηματισμού, επιλέξτε OK. Το αποτέλεσμα αυτής της λειτουργίας σάς παρέχει τις ακόλουθες πληροφορίες:
Σε αυτό το παράδειγμα, η επιλογή Παράβλεψη πεζών-κεφαλαίων ήταν ενεργοποιημένη, ώστε οι τιμές στη στήλη Από του πίνακα Μετασχηματισμού χρησιμοποιούνται για να αναζητήσουν τη συμβολοσειρά κειμένου χωρίς να εξεταστεί η περίπτωση της συμβολοσειράς. Αυτή η λειτουργία μετασχηματισμού πραγματοποιείται πρώτα και, στη συνέχεια, εκτελείται η ασαφής λειτουργία ομαδοποίησης.
Η βαθμολογία ομοιότητας εμφανίζεται επίσης στην τιμή πίνακα δίπλα στη στήλη ατόμου, η οποία αντικατοπτρίζει ακριβώς τον τρόπο με τον οποίο ομαδοποιήθηκαν οι τιμές και τις αντίστοιχες βαθμολογίες ομοιότητάς τους. Μπορείτε να αναπτύξετε αυτήν τη στήλη εάν είναι απαραίτητο ή να χρησιμοποιήσετε τις τιμές από τις νέες στήλες Συχνότητα για άλλα είδη μετασχηματισμών.
Σημείωση
Κατά την ομαδοποίηση κατά πολλές στήλες, ο πίνακας μετασχηματισμού εκτελεί τη λειτουργία αντικατάστασης σε όλες τις στήλες εάν η αντικατάσταση της τιμής αυξάνει τη βαθμολογία ομοιότητας.
Για περισσότερες πληροφορίες σχετικά με τον τρόπο λειτουργίας των πινάκων μετασχηματισμού, μεταβείτε τα διδάγματα του πίνακα Μετασχηματισμού.