Κοινή χρήση μέσω


Επιλογές για τη λήψη δεδομένων στο Fabric Lakehouse

Η εμπειρία λήψης δεδομένων καλύπτει όλα τα σενάρια χρήστη για τη μεταφορά δεδομένων στο lakehouse, όπως:

  • Σύνδεση σε υπάρχοντα SQL Server και αντιγραφή δεδομένων στον πίνακα Delta στο lakehouse.
  • Αποστολή αρχείων από τον υπολογιστή σας.
  • Αντιγραφή και συγχώνευση πολλών πινάκων από άλλες λίμνες σε έναν νέο πίνακα Delta.
  • Σύνδεση σε μια προέλευση ροής για τη γη δεδομένων σε ένα lakehouse.
  • Αναφορά δεδομένων χωρίς αντιγραφή από άλλες εσωτερικές λίμνες ή εξωτερικές προελεύσεις.

Διαφορετικοί τρόποι φόρτωσης δεδομένων σε ένα lakehouse

Στο Microsoft Fabric, υπάρχουν διάφοροι τρόποι για να λάβετε δεδομένα σε ένα lakehouse:

  • Αποστολή αρχείου από τοπικό υπολογιστή
  • Εκτέλεση εργαλείου αντιγραφής στις διοχετεύσεις
  • Ρύθμιση ροής δεδομένων
  • Βιβλιοθήκες Apache Spark σε κώδικα σημειωματάριου
  • Συμβάντα Stream σε πραγματικό χρόνο με το Eventstream
  • Λήψη δεδομένων από το Eventhouse

Αποστολή τοπικού αρχείου

Μπορείτε επίσης να αποστείλετε δεδομένα που είναι αποθηκευμένα στον τοπικό υπολογιστή σας. Μπορείτε να το κάνετε απευθείας στην εξερεύνηση του Lakehouse.

Στιγμιότυπο οθόνης του παραθύρου διαλόγου αποστολής αρχείων στην εξερεύνηση Lakehouse.

Αντιγραφή εργαλείου σε διοχετεύσεις

Το εργαλείο αντιγραφής είναι μια λύση ενοποίησης δεδομένων με πολλές επιλογές κλιμάκωσης, η οποία σας επιτρέπει να συνδεθείτε σε διαφορετικές προελεύσεις δεδομένων και να φορτώσετε τα δεδομένα είτε στην αρχική μορφή είτε σε έναν πίνακα Delta. Το εργαλείο αντιγραφής αποτελεί μέρος των δραστηριοτήτων διοχέτευσης που μπορείτε να τροποποιήσετε με πολλούς τρόπους, όπως προγραμματισμό ή ενεργοποίηση με βάση ένα συμβάν. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Τρόπος αντιγραφής δεδομένων με χρήση αντιγραφής δραστηριότητας.

Ροές δεδομένων

Για τους χρήστες που είναι εξοικειωμένοι με τις ροές δεδομένων Power BI, το ίδιο εργαλείο είναι διαθέσιμο για τη φόρτωση δεδομένων στο lakehouse σας. Μπορείτε να αποκτήσετε γρήγορα πρόσβαση σε αυτή από την επιλογή "Λήψη δεδομένων" της εξερεύνησης lakehouse και να φορτώσετε δεδομένα από πάνω από 200 συνδέσεις. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Γρήγορη εκκίνηση: Δημιουργήστε την πρώτη ροή δεδομένων για να λάβετε και να μετασχηματίσετε δεδομένα.

Κώδικας σημειωματάριου

Μπορείτε να χρησιμοποιήσετε τις διαθέσιμες βιβλιοθήκες Spark για να συνδεθείτε απευθείας σε μια προέλευση δεδομένων, να φορτώσετε δεδομένα σε ένα πλαίσιο δεδομένων και, στη συνέχεια, να τα αποθηκεύσετε σε ένα lakehouse. Αυτή η μέθοδος είναι ο πιο ανοιχτός τρόπος για τη φόρτωση δεδομένων στο lakehouse που διαχειρίζεται πλήρως ο κώδικας χρήστη.

Σημείωμα

Οι εξωτερικοί πίνακες Δέλτα που δημιουργούνται με κώδικα Spark δεν θα είναι ορατοί σε ένα τελικό σημείο ανάλυσης SQL. Χρησιμοποιήστε συντομεύσεις στον χώρο Πίνακας για να καταστήστε τους εξωτερικούς πίνακες Delta ορατούς για ένα τελικό σημείο ανάλυσης SQL.

Συμβάντα Stream σε πραγματικό χρόνο με το Eventstream

Με το Eventstream, μπορείτε να λαμβάνετε, να επεξεργάζεστε και να δρομολογείτε μεγάλους όγκους συμβάντων σε πραγματικό χρόνο από μια μεγάλη ποικιλία προελεύσεων.

Στιγμιότυπο οθόνης της λήψης δεδομένων σε ένα lakehouse από το Eventstream.

Για να δείτε πώς μπορείτε να προσθέσετε το lakehouse ως προορισμό για το Eventstream, ανατρέξτε στο θέμα Λήψη δεδομένων από το Eventstream σε ένα lakehouse.

Για βέλτιστες επιδόσεις ροής, μπορείτε να κάνετε ροή δεδομένων από το Eventstream σε μια Αποθήκη συμβάντων και, στη συνέχεια , να ενεργοποιήσετε τη διαθεσιμότητα OneLake.

Λήψη δεδομένων από το Eventhouse

Όταν ενεργοποιείτε τη διαθεσιμότητα OneLake σε δεδομένα σε μια Eventhouse, δημιουργείται ένας πίνακας Delta στο OneLake. Η πρόσβαση σε αυτόν τον πίνακα Delta είναι δυνατή μέσω ενός lakehouse με συντόμευση. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Συντομεύσεις OneLake. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Διαθεσιμότητα oneLake eventhouse.

Ζητήματα κατά την επιλογή προσέγγισης για τη φόρτωση δεδομένων

Υπόθεση χρήσης Σύσταση
Αποστολή μικρών αρχείων από τον τοπικό υπολογιστή Χρήση αποστολής τοπικού αρχείου
Μικρά δεδομένα ή συγκεκριμένη σύνδεση Χρήση ροών δεδομένων
Μεγάλη προέλευση δεδομένων Χρήση εργαλείου αντιγραφής σε διοχετεύσεις
Σύνθετοι μετασχηματισμοί δεδομένων Χρήση κώδικα σημειωματάριου
Δεδομένα ροής Χρήση της Eventstream για ροή δεδομένων στο Eventhouse. ενεργοποίηση διαθεσιμότητας OneLake και δημιουργία συντόμευσης από το Lakehouse
Δεδομένα χρονολογική σειράς Λήψη δεδομένων από το Eventhouse