Κοινή χρήση μέσω


Φόρτωση στον πίνακα Delta Lake

Το Lakehouse στο Microsoft Fabric παρέχει μια δυνατότητα για την αποτελεσματική φόρτωση κοινών τύπων αρχείων σε έναν βελτιστοποιημένο πίνακα Delta έτοιμο για ανάλυση. Η δυνατότητα Φόρτωση σε πίνακα επιτρέπει στους χρήστες να φορτώνουν ένα μοναδικό αρχείο ή φάκελο αρχείων σε έναν πίνακα. Αυτή η δυνατότητα αυξάνει την παραγωγικότητα για τους μηχανικούς δεδομένων, επιτρέποντάς τους να χρησιμοποιούν γρήγορα μια ενέργεια δεξιού κλικ για να επιτρέπουν τη φόρτωση πινάκων σε αρχεία και φακέλους. Η φόρτωση στον πίνακα είναι επίσης μια εμπειρία χωρίς κώδικα, η οποία μειώνει τη γραμμή καταχώρησης για όλες τις προσωπικότητες.

Επισκόπηση δυνατοτήτων φόρτωσης σε πίνακα

Ακολουθεί μια λίστα δυνατοτήτων που ενεργοποιήσαμε στην εμπειρία ενσωματωμένου φόρτου πίνακα για να παρέχουμε στους χρήστες μας ευελιξία, αυξάνοντας παράλληλα την παραγωγικότητά τους:

  • Υποστηριζόμενοι τύποι αρχείων: Αυτή η δυνατότητα προς το παρόν υποστηρίζει μόνο τη φόρτωση τύπων αρχείων PARQUET ή CSV. Η υπόθεση επέκτασης αρχείου δεν έχει σημασία.

  • Φόρτωση ενός αρχείου: Οι χρήστες μπορούν να φορτώσουν ένα μοναδικό αρχείο της επιλογής τους σε μία από τις υποστηριζόμενες μορφές, επιλέγοντας "Φόρτωση στον πίνακα Delta" στην ενέργεια μενού περιβάλλοντος του αρχείου.

  • Φόρτωση σε επίπεδο φακέλου: Μπορείτε να φορτώσετε όλα τα αρχεία κάτω από έναν φάκελο και τους υποφακέλους του ταυτόχρονα, επιλέγοντας "Φόρτωση στον πίνακα Delta" αφού κάνετε κλικ σε έναν φάκελο. Αυτή η δυνατότητα διασχίζει αυτόματα όλα τα αρχεία και τα φορτώνει σε έναν πίνακα Delta. Είναι σημαντικό να έχετε υπόψη ότι μόνο αρχεία του ίδιου τύπου μπορούν να φορτωθούν ταυτόχρονα σε έναν πίνακα.

  • Φόρτωση σε νέο και υπάρχοντα πίνακα: Ο χρήστης μπορεί να επιλέξει να φορτώσει τα αρχεία και τους φακέλους του σε έναν νέο πίνακα ή σε έναν υπάρχοντα πίνακα της επιλογής του. Εάν αποφασίσουν να επιλέξουν να φορτώσουν σε έναν υπάρχοντα πίνακα, μπορούν είτε να προσαρτήσουν είτε να αντικαταστήσουν τα δεδομένα τους στον πίνακα.

  • Επιλογή αρχείου προέλευσης CSV: Για αρχεία CSV, επιτρέπουμε στον χρήστη να καθορίσει αν το αρχείο προέλευσής τους περιλαμβάνει κεφαλίδες που θα ήθελαν να χρησιμοποιήσουν ως ονόματα στηλών. Οι χρήστες μπορούν επίσης να καθορίσουν ένα διαχωριστικό της επιλογής τους για να παρακάμψουν το προεπιλεγμένο διαχωριστικό κόμματος.

  • Φόρτωση ως πίνακες Δέλτα: Οι πίνακες φορτώνονται πάντα με χρήση της μορφής πίνακα Delta Lake με ενεργοποιημένη τη βελτιστοποίηση V-Order.

    Gif του συνολικού φακέλου φόρτωσης στην εμπειρία πίνακα.

Σημείωμα

Προς το παρόν, δεν μπορείτε να καθορίσετε το σχήμα πίνακα μέσω του περιβάλλοντος εργασίας χρήστη lakehouse. πρέπει να χρησιμοποιήσετε ένα σημειωματάριο για αυτόν τον σκοπό.

Οδηγίες και κανόνες επικύρωσης

Το ακόλουθο πρότυπο ισχύει για την εμπειρία Φόρτωση σε πίνακα:

  • Τα ονόματα πινάκων μπορούν να περιέχουν μόνο αλφαριθμητικούς χαρακτήρες και χαρακτήρες υπογράμμισης. Επιτρέπει επίσης οποιοδήποτε αγγλικό γράμμα, κεφαλαίο ή πεζό και χαρακτήρα υπογράμμισης (_), με μέγιστο μήκος 256 χαρακτήρες. Δεν επιτρέπονται παύλες (-) ή χαρακτήρες διαστήματος.

  • Τα αρχεία κειμένου χωρίς κεφαλίδες στηλών αντικαθίστανται με τυπική col# σημειογραφία ως ονόματα στηλών πίνακα.

  • Τα ονόματα στηλών επιτρέπουν οποιοδήποτε αγγλικό γράμμα, κεφαλαία ή πεζά γράμματα, χαρακτήρα υπογράμμισης (_) και χαρακτήρες σε άλλη γλώσσα, όπως τα Κινεζικά σε UTF, μήκους έως 128 χαρακτήρων. Τα ονόματα στηλών επικυρώνονται κατά την ενέργεια φόρτωσης. Ο αλγόριθμος Φόρτωση σε δέλτα αντικαθιστά τις απαγορευμένες τιμές με υπογράμιση (_). Εάν δεν επιτευχθεί κατάλληλο όνομα στήλης κατά την επικύρωση, η ενέργεια φόρτωσης αποτυγχάνει.

  • Για τα αρχεία CSV, το διαχωριστικό δεν μπορεί να είναι κενό, δεν μπορεί να είναι μεγαλύτερο από 8 χαρακτήρες ή να χρησιμοποιεί οποιονδήποτε από τους ακόλουθους χαρακτήρες: (, ), , ][, ,{} μονά εισαγωγικά ('), διπλά εισαγωγικά (") και κενό διάστημα.