Χρήση του API Livy για την υποβολή και εκτέλεση εργασιών Spark
Σημείωμα
Το Livy API για τη Μηχανική δεδομένων Fabric είναι σε προεπισκόπηση.
Ισχύει για:✅ Διαχείριση δεδομένων και Επιστήμη δεδομένων στο Microsoft Fabric
Ξεκινήστε με το Livy API για τη μηχανική δεδομένων Fabric δημιουργώντας ένα Lakehouse. έλεγχος ταυτότητας με διακριτικό εφαρμογής Microsoft Entra, υποβάλετε εργασίες δέσμης ή περιόδου λειτουργίας από ένα απομακρυσμένο πρόγραμμα-πελάτη στην υπολογιστική fabric Spark. Θα ανακαλύψετε το τελικό σημείο του API Livy. την υποβολή θέσεων εργασίας· και παρακολουθήστε τα αποτελέσματα.
Προαπαιτούμενα στοιχεία
Χωρητικότητα Premium fabric ή δοκιμαστικής έκδοσης με ένα LakeHouse
Ενεργοποίηση της ρύθμισης διαχειριστή μισθωτή για το API Livy (προεπισκόπηση)
Ένα απομακρυσμένο πρόγραμμα-πελάτης, όπως το Visual Studio Code με υποστήριξη σημειωματάριου Jupyter, το PySpark και τη Βιβλιοθήκη ελέγχου ταυτότητας της Microsoft (MSAL) για Python
Για να αποκτήσετε πρόσβαση στο Rest API Fabric, απαιτείται ένα διακριτικό εφαρμογής Microsoft Entra. Καταχώρηση μιας εφαρμογής στην πλατφόρμα ταυτότητας της Microsoft
Επιλογή προγράμματος-πελάτη REST API
Μπορείτε να χρησιμοποιήσετε διάφορες γλώσσες προγραμματισμού ή προγράμματα-πελάτες GUI για να αλληλεπιδράσετε με τελικά σημεία REST API. Σε αυτό το άρθρο, χρησιμοποιούμε Κώδικα Visual Studio. Οι παράμετροι του Visual Studio Code πρέπει να ρυθμιστούν με τα Jupyter Notebooks, PySpark και τη Βιβλιοθήκη ελέγχου ταυτότητας της Microsoft (MSAL) για Python
Πώς μπορείτε να εξουσιοδοτήσετε τις αιτήσεις API Livy
Για να εργαστείτε με API Fabric συμπεριλαμβανομένου του API Livy, πρέπει πρώτα να δημιουργήσετε μια εφαρμογή Microsoft Entra και να λάβετε ένα διακριτικό. Η εφαρμογή σας πρέπει να καταχωρηθεί και ρυθμιστεί επαρκώς για την εκτέλεση κλήσεων API στο Fabric. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Καταχώρηση μιας εφαρμογής με την πλατφόρμα ταυτότητας της Microsoft.
Υπάρχουν πολλά δικαιώματα εμβέλειας Microsoft Entra που απαιτούνται για την εκτέλεση εργασιών Livy. Αυτό το παράδειγμα χρησιμοποιεί απλό κώδικα Spark + πρόσβαση στον χώρο αποθήκευσης + SQL:
- Code.AccessAzureDataExplorer.All
- Code.AccessAzureDataLake.All
- Code.AccessAzureKeyvault.All
- Code.AccessFabric.All
- Code.AccessStorage.All
- Item.ReadWrite.All
- Lakehouse.Execute.All
- Lakehouse.Read.All
- Workspace.ReadWrite.All
Σημείωμα
Κατά τη διάρκεια της δημόσιας προεπισκόπησης θα προσθέσουμε μερικές επιπλέον λεπτομερείς εμβέλειες και αν χρησιμοποιήσετε αυτή την προσέγγιση, όταν προσθέσουμε αυτές τις πρόσθετες εμβέλειες η εφαρμογή Livy θα διακοπεί. Ελέγξτε αυτήν τη λίστα καθώς θα ενημερώνεται με τις πρόσθετες εμβέλειες.
Ορισμένοι πελάτες θέλουν πιο λεπτομερή δικαιώματα από την προηγούμενη λίστα. Θα μπορούσατε να καταργήσετε την Item.ReadWrite.All και να αντικαταστήσετε αυτά τα πιο λεπτομερή δικαιώματα εμβέλειας:
- Code.AccessAzureDataExplorer.All
- Code.AccessAzureDataLake.All
- Code.AccessAzureKeyvault.All
- Code.AccessFabric.All
- Code.AccessStorage.All
- Lakehouse.Execute.All
- Lakehouse.ReadWrite.All
- Workspace.ReadWrite.All
- Notebook.ReadWrite.All
- SparkJobDefinition.ReadWrite.All
- MLModel.ReadWrite.All
- MLExperiment.ReadWrite.All
- Dataset.ReadWrite.All
Όταν καταχωρήσετε την εφαρμογή σας, θα χρειαστείτε το αναγνωριστικό εφαρμογής (πρόγραμμα-πελάτης) και το αναγνωριστικό καταλόγου (μισθωτής).
Ο εξουσιοδοτημένος χρήστης που καλεί το API Livy πρέπει να είναι μέλος του χώρου εργασίας όπου βρίσκονται τόσο το API όσο και τα στοιχεία προέλευσης δεδομένων με ρόλο Συμβάλλοντα. Για περισσότερες πληροφορίες, ανατρέξτε στο θέμα Παροχή πρόσβασης στους χρήστες σε χώρους εργασίας.
Πώς να ανακαλύψετε το τελικό σημείο API Fabric Livy
Ένα αντικείμενο σχεδίασης Lakehouse απαιτείται για πρόσβαση στο τελικό σημείο Livy. Μόλις δημιουργηθεί το Lakehouse, το τελικό σημείο του Livy API μπορεί να βρίσκεται στον πίνακα ρυθμίσεων.
Το τελικό σημείο του API Livy θα ακολουθήσει το εξής μοτίβο:
https://api.fabric.microsoft.com/v1/workspaces/ < >ws_id/lakehouses/<lakehouse_id>/livyapi/versions/2023-12-01/
Η διεύθυνση URL προσαρτάται με <περιόδους λειτουργίας> ή <δέσμες> ανάλογα με αυτό που επιλέγετε.
Ενοποίηση με περιβάλλοντα Fabric
Για κάθε χώρο εργασίας Fabric, παρέχεται μια προεπιλεγμένη ομάδα εκκίνησης, η εκτέλεση όλων των spark code χρησιμοποιούν αυτή την ομάδα εκκίνησης από προεπιλογή. Μπορείτε να χρησιμοποιήσετε περιβάλλοντα Fabric για να προσαρμόσετε τις εργασίες Livy API Spark.
Λήψη των αρχείων Livy API Swagger
Τα πλήρη αρχεία swagger για το API Livy είναι διαθέσιμα εδώ.
Υποβολή εργασιών API Livy
Τώρα που ολοκληρώθηκε η εγκατάσταση του API Livy, μπορείτε να επιλέξετε να υποβάλετε εργασίες δέσμης ή περιόδου λειτουργίας.
- Υποβολή εργασιών περιόδου λειτουργίας με χρήση του API Livy
- Υποβολή εργασιών δέσμης με χρήση του API Livy
Τρόπος παρακολούθησης του ιστορικού αιτήσεων
Μπορείτε να χρησιμοποιήσετε το Κέντρο παρακολούθησης για να δείτε τις προηγούμενες υποβολές σας API Livy και να εντοπίσετε σφάλματα στις υποβολές σας.
Σχετικό περιεχόμενο
- Τεκμηρίωση API REST Apache Livy
- Γρήγορα αποτελέσματα με τις ρυθμίσεις διαχείρισης για τους εκχωρημένους πόρους Fabric σας
- Ρυθμίσεις διαχείρισης χώρου εργασίας Apache Spark στο Microsoft Fabric
- Καταχώρηση μιας εφαρμογής στην πλατφόρμα ταυτότητας της Microsoft
- Επισκόπηση δικαιωμάτων και συγκατάθεσης της Microsoft Entra
- Εμβέλειες REST API Fabric
- Επισκόπηση παρακολούθησης Apache Spark
- Λεπτομέρεια εφαρμογής Apache Spark