Κοινή χρήση μέσω


Μετάδοση σημασιολογικών δεδομένων από σημασιολογικά μοντέλα

Όταν διαβάζετε ένα σημασιολογικό μοντέλο σε ένα FabricDataFrame, σημασιολογικές πληροφορίες όπως μετα-δεδομένα και σχόλια από το μοντέλο σημασιολογίας συνδέονται αυτόματα στο FabricDataFrame. Σε αυτό το άρθρο, θα μάθετε πώς η βιβλιοθήκη SemPy Python διατηρεί τα σχόλια που συνδέονται σε πίνακες και στήλες ενός μοντέλου σημασιολογίας.

Σημασιολογική μετάδοση για χρήστες pandas

Η βιβλιοθήκη SemPy Python αποτελεί μέρος της δυνατότητας σημασιολογίας σύνδεσης και εξυπηρετεί τους χρήστες pandas . Το SemPy υποστηρίζει τις λειτουργίες που σας επιτρέπουν τα pandas να εκτελείτε στα δεδομένα σας.

Το SemPy σάς επιτρέπει επίσης να μεταδίδετε σημασιολογικά δεδομένα από σημασιολογικά μοντέλα στα οποία χρησιμοποιείτε. Με τη μετάδοση σημασιολογικών δεδομένων, μπορείτε να διατηρήσετε σχόλια που συνδέονται σε πίνακες και στήλες στο μοντέλο σημασιολογίας όταν εκτελείτε λειτουργίες όπως ανάλυση, συγχωνεύσεις και συνένωση.

Μπορείτε να δημιουργήσετε μια δομή δεδομένων FabricDataFrame με έναν από τους εξής δύο τρόπους:

  • Μπορείτε να διαβάσετε έναν πίνακα ή το αποτέλεσμα μιας μέτρησης από ένα μοντέλο σημασιολογίας σε ένα FabricDataFrame.

    Όταν διαβάζετε από ένα σημασιολογικό μοντέλο σε ένα FabricDataFrame, τα μετα-δεδομένα από το Power BI ενυδατώνουν αυτόματα ή συμπληρώνουν το FabricDataFrame. Με άλλα λόγια, το FabricDataFrame διατηρεί τις σημασιολογικές πληροφορίες από τους πίνακες ή τις μετρήσεις του μοντέλου.

  • Μπορείτε να χρησιμοποιήσετε δεδομένα στη μνήμη για να δημιουργήσετε το FabricDataFrame, ακριβώς όπως κάνετε για pandas DataFrames.

    Όταν δημιουργείτε ένα FabricDataFrame από δεδομένα στη μνήμη, πρέπει να καταχωρήσετε το όνομα ενός μοντέλου σημασιολογίας από το οποίο το FabricDataFrame μπορεί να αντλήσει πληροφορίες μετα-δεδομένων.

Ο τρόπος με τον οποίο το SemPy διατηρεί τα σημασιολογικά δεδομένα ποικίλλει ανάλογα με παράγοντες όπως οι λειτουργίες που κάνετε και η σειρά των FabricDataFrames στα οποία χρησιμοποιείτε.

Σημασιολογική μετάδοση με συγχώνευση

Όταν συγχωνεύετε δύο FabricDataFrames, η σειρά των DataFrames καθορίζει τον τρόπο με τον οποίο το SemPy μεταδίδει σημασιολογικές πληροφορίες.

  • Εάν και τα δύο FabricDataFrames έχουν σχόλια, τα μετα-δεδομένα επιπέδου πίνακα του αριστερού FabricDataFrame έχουν προτεραιότητα. Ο ίδιος κανόνας ισχύει για μεμονωμένες στήλες. τα σχόλια στήλης στο αριστερό FabricDataFrame έχουν προτεραιότητα έναντι των σχολίων στήλης στο δεξιό DataFrame.

  • Εάν σχολιάσετε μόνο ένα FabricDataFrame, το SemPy χρησιμοποιεί τα μετα-δεδομένα του. Ο ίδιος κανόνας ισχύει για μεμονωμένες στήλες. Το SemPy χρησιμοποιεί τα σχόλια στήλης που υπάρχουν στο σχολιασμό FabricDataFrame.

Σημασιολογική μετάδοση με συνένωση

Όταν συνενώνετε πολλά FabricDataFrame, για κάθε στήλη, το SemPy αντιγράφει τα μετα-δεδομένα από το πρώτο FabricDataFrame που συμφωνεί με το όνομα της στήλης. Εάν υπάρχουν πολλές αντιστοιχίες και τα μετα-δεδομένα δεν είναι ίδια, το SemPy εκδίδει μια προειδοποίηση.

Μπορείτε επίσης να μεταδώσετε συνένωση των FabricDataFrames με κανονικά pandas DataFrames, τοποθετώντας πρώτα το FabricDataFrame.

Σημασιολογική μετάδοση για τους χρήστες Spark

Η σημασιολογική σύνδεση Εγγενής σύνδεση Spark ενυδατώνει (ή συμπληρώνει) το λεξικό μετα-δεδομένων μιας στήλης Spark. Προς το παρόν, η υποστήριξη για τη μετάδοση σημασιολογίας είναι περιορισμένη και υπόκειται στην εσωτερική υλοποίηση του Spark για τον τρόπο μετάδοσης των πληροφοριών σχήματος. Για παράδειγμα, η συνάθροιση στηλών καταργεί τα μετα-δεδομένα.