Κοινή χρήση μέσω


Τι είναι η σημασιολογική σύνδεση;

Η σημασιολογική σύνδεση είναι μια δυνατότητα που σας επιτρέπει να δημιουργήσετε μια σύνδεση μεταξύ σημασιολογικών μοντέλων και της επιστήμης δεδομένων Synapse στο Microsoft Fabric. Η χρήση της σημασιολογικής σύνδεσης υποστηρίζεται μόνο στο Microsoft Fabric.

  • Για το Spark 3.4 και νεότερες εκδόσεις, η σημασιολογική σύνδεση είναι διαθέσιμη στον προεπιλεγμένο χρόνο εκτέλεσης όταν χρησιμοποιείτε το Fabric και δεν χρειάζεται να την εγκαταστήσετε.

  • Για το Spark 3.3 ή παρακάτω ή για ενημέρωση στην πιο πρόσφατη έκδοση της σημασιολογικής σύνδεσης, εκτελέστε την ακόλουθη εντολή:

    %pip install -U semantic-link
    

Οι κύριοι στόχοι της σημασιολογικής σύνδεσης είναι οι εξής:

  • Διευκόλυνση της συνδεσιμότητας δεδομένων.
  • Ενεργοποιήστε τη μετάδοση σημασιολογικών πληροφοριών.
  • Απρόσκοπτη ενοποίηση με καθιερωμένα εργαλεία που χρησιμοποιούν οι επιστήμονες δεδομένων, όπως σημειωματάρια.

Η σημασιολογική σύνδεση σάς βοηθά να διατηρήσετε τις γνώσεις τομέα σχετικά με τη σημασιολογία δεδομένων με έναν τυποποιημένο τρόπο που μπορεί να επιταχύνει την ανάλυση δεδομένων και να μειώσει τα σφάλματα.

Η ροή δεδομένων σημασιολογίας σύνδεσης ξεκινά με σημασιολογικά μοντέλα που περιέχουν δεδομένα και σημασιολογικές πληροφορίες. Η σημασιολογική σύνδεση γεφυρώνει το χάσμα μεταξύ του Power BI και της εμπειρίας Synapse Data Science.

Ένα διάγραμμα που εμφανίζει τη ροή δεδομένων από το Power BI σε σημειωματάρια στην Επιστήμη δεδομένων Synapse και επιστροφή στο Power BI.

Η Σύνδεση σημασιολογίας σάς επιτρέπει να χρησιμοποιείτε σημασιολογικά μοντέλα από το Power BI στην εμπειρία Synapse Data Science για την εκτέλεση εργασιών όπως λεπτομερή στατιστική ανάλυση και προγνωστική μοντελοποίηση με τεχνικές εκμάθησης μηχανής. Μπορείτε να αποθηκεύσετε το αποτέλεσμα της εργασίας επιστήμης δεδομένων σε OneLake χρησιμοποιώντας το Apache Spark και να προσλάβετε το αποθηκευμένο αποτέλεσμα στο Power BI χρησιμοποιώντας το Direct Lake.

Συνδεσιμότητα Του Power BI

Ένα σημασιολογικό μοντέλο χρησιμεύει ως ένα μοντέλο αντικειμένου σε μορφή πίνακα που παρέχει αξιόπιστες προελεύσεις για σημασιολογικούς ορισμούς, όπως μετρήσεις Power BI. Η σημασιολογική σύνδεση συνδέεται με σημασιολογικά μοντέλα στα ακόλουθα οικοσυστήματα, διευκολύνοντας τους επιστήμονες δεδομένων να εργάζονται στο σύστημα με το οποίο είναι πιο εξοικειωμένοι.

  • Οικοσύστημα Python pandas , μέσω της βιβλιοθήκης SemPy Python.
  • Οικοσύστημα Apache Spark , μέσω της εγγενούς σύνδεσης Spark. Αυτή η υλοποίηση υποστηρίζει διάφορες γλώσσες, όπως τα PySpark, Spark SQL, R και Scala.

Εφαρμογές σημασιολογικών πληροφοριών

Οι σημασιολογικές πληροφορίες στα δεδομένα περιλαμβάνουν κατηγορίες δεδομένων power BI, όπως διεύθυνση και ταχυδρομικό κώδικα, σχέσεις μεταξύ πινάκων και ιεραρχικές πληροφορίες.

Αυτές οι κατηγορίες δεδομένων περιλαμβάνουν μετα-δεδομένα που συνδέονται σημασιολογικά, τα οποία μεταδίδονται στο περιβάλλον Synapse Data Science για την ενεργοποίηση νέων εμπειριών και τη διατήρηση της καταγωγής των δεδομένων.

Ορισμένα παραδείγματα εφαρμογών σημασιολογικής σύνδεσης περιλαμβάνουν τα εξής:

  • Έξυπνες προτάσεις ενσωματωμένων σημασιολογικών συναρτήσεων.
  • Καινοτόμος ενοποίηση για την ενίσχυση δεδομένων με μετρήσεις Power BI, με χρήση πρόσθετων μετρήσεων.
  • Εργαλεία επικύρωσης ποιότητας δεδομένων με βάση τις σχέσεις μεταξύ πινάκων και λειτουργικών εξαρτήσεων εντός πινάκων.

Η σημασιολογική σύνδεση είναι ένα ισχυρό εργαλείο που επιτρέπει στους επιχειρηματικούς αναλυτές να χρησιμοποιούν τα δεδομένα αποτελεσματικά σε ένα ολοκληρωμένο περιβάλλον επιστήμης δεδομένων.

Η σημασιολογική σύνδεση διευκολύνει την απρόσκοπτη συνεργασία μεταξύ των επιστημόνων δεδομένων και των επιχειρηματικών αναλυτών, εξαλείφοντας την ανάγκη εκ νέου εφαρμογής επιχειρηματικής λογικής ενσωματωμένης σε μετρήσεις του Power BI. Αυτή η προσέγγιση εξασφαλίζει ότι αμφότερα τα μέρη μπορούν να εργάζονται αποτελεσματικά και παραγωγικά, μεγιστοποιώντας τις δυνατότητες των πληροφοριών που βασίζονται σε δεδομένα.

Δομή δεδομένων FabricDataFrame

Το FabricDataFrame είναι η κύρια δομή δεδομένων που χρησιμοποιεί η σημασιολογική σύνδεση για τη μετάδοση σημασιολογικών πληροφοριών από σημασιολογικά μοντέλα στο περιβάλλον Synapse Data Science.

Ένα διάγραμμα που εμφανίζει τη ροή δεδομένων από συνδέσεις σε σημασιολογικά μοντέλα στο FabricDataFrame σε σημασιολογικές συναρτήσεις.

Η FabricDataFrame κλάση:

  • Υποστηρίζει όλες τις λειτουργίες pandas.
  • Υποκατηγορεί το DataFrame pandas και προσθέτει μετα-δεδομένα, όπως σημασιολογικές πληροφορίες και γενεαλογία.
  • Εκθέτει σημασιολογικές συναρτήσεις και τη μέθοδο προσθήκης μέτρησης που σας επιτρέπει να χρησιμοποιείτε μετρήσεις του Power BI στην εργασία επιστήμης δεδομένων.