OneLake, το OneDrive για δεδομένα
Το OneLake είναι μια ενιαία, ενοποιημένη, λογική λίμνη δεδομένων για ολόκληρο τον οργανισμό σας. Ένα data Lake επεξεργάζεται μεγάλους όγκους δεδομένων από διάφορες προελεύσεις. Όπως το OneDrive, το OneLake παρέχεται αυτόματα με κάθε μισθωτή Microsoft Fabric και έχει σχεδιαστεί για να είναι το μοναδικό σημείο για όλα τα δεδομένα αναλύσεων. Το OneLake φέρνει πελάτες:
- Μία λίμνη δεδομένων για ολόκληρο τον οργανισμό
- Ένα αντίγραφο δεδομένων για χρήση με πολλούς μηχανισμούς ανάλυσης
Μία λίμνη δεδομένων για ολόκληρο τον οργανισμό
Πριν από το OneLake, ήταν πιο εύκολο για τους πελάτες να δημιουργήσουν πολλές λίμνες για διαφορετικούς επιχειρηματικούς ομίλους αντί να συνεργαστούν σε μια μοναδική λίμνη, ακόμη και με τα επιπλέον έξοδα διαχείρισης πολλών πόρων. Το OneLake εστιάζει στην κατάργηση αυτών των προκλήσεων με τη βελτίωση της συνεργασίας. Κάθε μισθωτής πελάτη έχει ακριβώς μία OneLake. Δεν μπορεί να υπάρχουν περισσότερες από μία και αν έχετε Fabric, δεν μπορεί ποτέ να υπάρχει μηδέν. Κάθε μισθωτής Fabric προμηθεύει αυτόματα το OneLake, χωρίς επιπλέον πόρους για ρύθμιση ή διαχείριση.
Διέπεται από προεπιλογή με κατανεμημένη ιδιοκτησία για συνεργασία
Η έννοια ενός μισθωτή είναι ένα μοναδικό πλεονέκτημα της υπηρεσίας SaaS. Η γνώση του σημείου όπου ο οργανισμός ενός πελάτη ξεκινά και τελειώνει παρέχει ένα όριο φυσικής διακυβέρνησης και συμμόρφωσης, το οποίο βρίσκεται υπό τον έλεγχο ενός διαχειριστή μισθωτή. Τα δεδομένα που μεταβαίνουν στο OneLake διέπονται από προεπιλογή. Παρόλο που όλα τα δεδομένα είναι εντός των ορίων που ορίζονται από τον διαχειριστή του μισθωτή, είναι σημαντικό αυτός ο διαχειριστής να μην γίνει ένας κεντρικός ελεγκτής πύλης που δεν επιτρέπει σε άλλα μέρη του οργανισμού να συμβάλλουν στο OneLake.
Εντός ενός μισθωτή, μπορείτε να δημιουργήσετε οποιονδήποτε αριθμό χώρων εργασίας. Οι χώροι εργασίας επιτρέπουν σε διαφορετικά μέρη του οργανισμού να διανέμουν πολιτικές ιδιοκτησίας και πρόσβασης. Κάθε χώρος εργασίας αποτελεί μέρος ενός συνόλου εκχωρημένων πόρων που συνδέεται με μια συγκεκριμένη περιοχή και τιμολογείται ξεχωριστά.
Μέσα σε έναν χώρο εργασίας, μπορείτε να δημιουργήσετε στοιχεία δεδομένων και να αποκτήσετε πρόσβαση σε όλα τα δεδομένα στο OneLake μέσω στοιχείων δεδομένων. Παρόμοια με τον τρόπο που το Office αποθηκεύει αρχεία Word, Excel και PowerPoint στο OneDrive, το Fabric αποθηκεύει lakehouses, αποθήκες και άλλα στοιχεία στο OneLake. Τα στοιχεία μπορούν να δώσουν προσαρμοσμένες εμπειρίες για κάθε προσωπικότητα, όπως η εμπειρία προγραμματιστή Apache Spark σε ένα lakehouse.
Για περισσότερες πληροφορίες σχετικά με τον τρόπο για να ξεκινήσετε να χρησιμοποιείτε το OneLake, ανατρέξτε στο θέμα Δημιουργία ενός lakehouse με OneLake.
Άνοιγμα σε κάθε επίπεδο
Το OneLake είναι ανοιχτό σε κάθε επίπεδο. Το OneLake βασίζεται στο Azure Data Lake Storage (ADLS) Gen2 και μπορεί να υποστηρίζει οποιονδήποτε τύπο αρχείου, δομημένο ή μη δομημένο. Όλα τα στοιχεία δεδομένων Fabric, όπως αποθήκες δεδομένων και lakehouses αποθηκεύουν τα δεδομένα τους αυτόματα σε μορφή OneLake σε Delta Parquet. Εάν ένας μηχανικός δεδομένων φορτώσει δεδομένα σε μια λίμνη χρησιμοποιώντας το Apache Spark και, στη συνέχεια, ένας προγραμματιστής SQL χρησιμοποιήσει T-SQL για τη φόρτωση δεδομένων σε μια αποθήκη δεδομένων πλήρως συναλλαγών, και οι δύο συμβάλλουν στην ίδια λίμνη δεδομένων. Το OneLake αποθηκεύει όλα τα δεδομένα σε μορφή πίνακα σε μορφή Delta Parquet.
Το OneLake υποστηρίζει τα ίδια ADLS Gen2 API και SDK για να είναι συμβατά με υπάρχουσες εφαρμογές ADLS Gen2, συμπεριλαμβανομένων των Azure Databricks. Μπορείτε να απευθυνθείτε σε δεδομένα στο OneLake σαν να πρόκειται για έναν μεγάλο λογαριασμό χώρου αποθήκευσης ADLS για ολόκληρο τον οργανισμό. Κάθε χώρος εργασίας εμφανίζεται ως κοντέινερ στον συγκεκριμένο λογαριασμό χώρου αποθήκευσης και διαφορετικά στοιχεία δεδομένων εμφανίζονται ως φάκελοι μέσα σε αυτά τα κοντέινερ.
Για περισσότερες πληροφορίες σχετικά με τα API και τα τελικά σημεία, ανατρέξτε στο θέμα Πρόσβαση OneLake και API. Για παραδείγματα ενοποιήσεων OneLake με το Azure, ανατρέξτε στα άρθρα Azure Synapse Analytics, Εξερεύνηση αποθήκευσης Azure, Azure Databricks και Azure HDInsight .
Εξερεύνηση αρχείων OneLake για Windows
Το OneLake είναι το OneDrive για δεδομένα. Όπως ακριβώς και το OneDrive, μπορείτε να εξερευνήσετε εύκολα δεδομένα OneLake από τα Windows χρησιμοποιώντας την εξερεύνηση αρχείων OneLake για Windows. Μπορείτε να περιηγηθείτε σε όλους τους χώρους εργασίας και τα στοιχεία δεδομένων σας, να κάνετε εύκολα αποστολή, λήψη ή τροποποίηση αρχείων, όπως ακριβώς κάνετε στο Office. Η εξερεύνηση αρχείων OneLake απλοποιεί την εργασία με λίμνες δεδομένων, επιτρέποντας ακόμη και στους μη επιχειρηματικούς χρήστες να τις χρησιμοποιούν.
Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Εξερεύνηση αρχείων OneLake.
Ένα αντίγραφο δεδομένων
Η OneLake έχει ως στόχο να σας δώσει τη μεγαλύτερη δυνατή αξία από ένα μοναδικό αντίγραφο δεδομένων χωρίς μετακίνηση ή αντιγραφή δεδομένων. Δεν χρειάζεται πλέον να αντιγράψετε δεδομένα απλώς για να τα χρησιμοποιήσετε με άλλη μηχανή ή για να αναλύσετε σιλό, ώστε να μπορείτε να αναλύσετε τα δεδομένα με δεδομένα από άλλες προελεύσεις.
Οι συντομεύσεις συνδέουν δεδομένα μεταξύ τομέων χωρίς μετακίνηση δεδομένων
Οι συντομεύσεις επιτρέπουν στον οργανισμό σας να κάνει εύκολα κοινή χρήση δεδομένων μεταξύ χρηστών και εφαρμογών χωρίς να χρειάζεται να μετακινήσετε και να αναπαραγάγετε πληροφορίες χωρίς λόγο. Όταν οι ομάδες εργάζονται ανεξάρτητα σε ξεχωριστούς χώρους εργασίας, οι συντομεύσεις σάς επιτρέπουν να συνδυάσετε δεδομένα σε διαφορετικούς επιχειρηματικούς ομίλους και τομείς σε ένα εικονικό προϊόν δεδομένων για να ικανοποιήσετε τις συγκεκριμένες ανάγκες ενός χρήστη.
Μια συντόμευση είναι μια αναφορά σε δεδομένα που είναι αποθηκευμένα σε άλλες θέσεις αρχείων. Αυτές οι θέσεις αρχείων μπορεί να βρίσκονται στον ίδιο χώρο εργασίας ή σε διαφορετικούς χώρους εργασίας, εντός του OneLake ή εξωτερικά του OneLake στο ADLS, το S3 ή το Dataverse, με περισσότερες τοποθεσίες προορισμού να έρχονται σύντομα. Ανεξάρτητα από τη θέση, οι συντομεύσεις κάνουν τα αρχεία και τους φακέλους να μοιάζουν όπως ότι τα έχετε αποθηκεύσει τοπικά.
Για περισσότερες πληροφορίες σχετικά με τον τρόπο χρήσης συντομεύσεων, ανατρέξτε στο θέμα Συντομεύσεις OneLake.
Ένα αντίγραφο δεδομένων με πολλούς μηχανισμούς ανάλυσης
Ενώ οι εφαρμογές μπορεί να έχουν διαχωρισμό χώρου αποθήκευσης και υπολογισμού, τα δεδομένα συχνά βελτιστοποιούνται για έναν μόνο μηχανισμό, το οποίο καθιστά δύσκολη την επαναχρησιμοποίηση των ίδιων δεδομένων για πολλές εφαρμογές. Με το Fabric, οι διαφορετικοί κινητήρες ανάλυσης (T-SQL, Apache Spark, Υπηρεσίες ανάλυσης κ.λπ.) αποθηκεύουν δεδομένα σε ανοιχτή μορφή Delta Parquet για να σας επιτρέψουν να χρησιμοποιήσετε τα ίδια δεδομένα σε πολλούς κινητήρες.
Δεν χρειάζεται πλέον να αντιγράψετε δεδομένα μόνο για να τα χρησιμοποιήσετε με έναν άλλο μηχανισμό. Μπορείτε πάντα να επιλέξετε την καλύτερη μηχανή για τη δουλειά που προσπαθείτε να κάνετε. Για παράδειγμα, φανταστείτε ότι έχετε μια ομάδα μηχανικών SQL που δημιουργούν μια αποθήκη δεδομένων πλήρως συναλλαγών. Μπορούν να χρησιμοποιήσουν τον μηχανισμό T-SQL και όλη την ισχύ του T-SQL για να δημιουργήσουν πίνακες, να μετασχηματίσουν δεδομένα και να φορτώσουν τα δεδομένα σε πίνακες. Εάν ένας επιστήμονας δεδομένων θέλει να χρησιμοποιήσει αυτά τα δεδομένα, δεν χρειάζεται πλέον να περάσει από ένα ειδικό πρόγραμμα οδήγησης Spark/SQL. Το OneLake αποθηκεύει όλα τα δεδομένα σε μορφή Delta Parquet. Οι επιστήμονες δεδομένων μπορούν να χρησιμοποιήσουν την πλήρη ισχύ του μηχανισμού Spark και των βιβλιοθηκών ανοιχτού κώδικα απευθείας πάνω από τα δεδομένα.
Οι χρήστες επιχειρήσεων μπορούν να δημιουργήσουν αναφορές Power BI απευθείας πάνω από το OneLake χρησιμοποιώντας τη νέα λειτουργία Direct Lake στη μηχανή των Υπηρεσιών ανάλυσης. Ο μηχανισμός Υπηρεσιών ανάλυσης είναι αυτό που παρέχει τα σημασιολογικά μοντέλα Power BI και παρέχει πάντα δύο τρόπους πρόσβασης σε δεδομένα: εισαγωγή και άμεσο ερώτημα. Η λειτουργία Direct Lake παρέχει στους χρήστες όλη την ταχύτητα εισαγωγής χωρίς να χρειάζεται να αντιγράψουν τα δεδομένα, συνδυάζοντας τα καλύτερα στοιχεία εισαγωγής και direct query. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Direct Lake.
Παράδειγμα διαγράμματος που εμφανίζει τη φόρτωση δεδομένων με χρήση του Spark, την υποβολή ερωτημάτων με χρήση T-SQL και την προβολή των δεδομένων σε μια αναφορά Power BI.