Bruk Livy-API-en til å sende inn og utføre Spark-jobber
Merk
Livy API for Fabric Dataingeniør ing er i forhåndsvisning.
Gjelder for:✅ Dataingeniør ing og datavitenskap i Microsoft Fabric
Kom i gang med Livy API for Fabric Dataingeniør ing ved å opprette en Lakehouse, godkjenne med et Microsoft Entra-apptoken, sende inn enten batch- eller øktjobber fra en ekstern klient til Fabric Spark-databehandling. Du vil oppdage Livy API-endepunktet. sende inn jobber; og overvåk resultatene.
Forutsetning
Fabric Premium- eller Prøveversjonskapasitet med LakeHouse
Aktiver leieradministratorinnstillingen for Livy API (forhåndsvisning)
En ekstern klient som Visual Studio Code med støtte for Jupyter-notatblokk, PySpark og Microsoft Authentication Library (MSAL) for Python
Et Microsoft Entra-apptoken kreves for å få tilgang til Fabric Rest-API-en. Registrere et program med Microsofts identitetsplattform
Velge en REST-API-klient
Du kan bruke ulike programmeringsspråk eller GUI-klienter til å samhandle med REST API-endepunkter. I denne artikkelen bruker vi Visual Studio Code. Visual Studio Code må konfigureres med Jupyter-notatblokker, PySpark og Microsoft Authentication Library (MSAL) for Python
Slik godkjenner du Livy API-forespørsler
Hvis du vil arbeide med Stoff-API-er, inkludert Livy API, må du først opprette et Microsoft Entra-program og skaffe et token. Programmet må være registrert og konfigurert tilstrekkelig til å utføre API-anrop mot Fabric. Hvis du vil ha mer informasjon, kan du se Registrere et program med Microsofts identitetsplattform.
Det er mange tillatelser for Microsoft Entra-omfang som kreves for å utføre Livy-jobber. Dette eksemplet bruker enkel Spark-kode + lagringstilgang + SQL:
- Code.AccessAzureDataExplorer.All
- Code.AccessAzureDataLake.All
- Code.AccessAzureKeyvault.All
- Code.AccessFabric.All
- Code.AccessStorage.All
- Item.ReadWrite.All
- Lakehouse.Execute.All
- Lakehouse.Read.All
- Workspace.ReadWrite.All
Merk
Under offentlig forhåndsvisning legger vi til noen ekstra detaljerte omfang, og hvis du bruker denne fremgangsmåten, vil Livy-appen brytes når vi legger til disse ekstra omfangene. Kontroller denne listen fordi den oppdateres med de ekstra omfangene.
Noen kunder ønsker mer detaljerte tillatelser enn den forrige listen. Du kan fjerne Item.ReadWrite.All og erstatte med disse mer detaljerte omfangstillatelsene:
- Code.AccessAzureDataExplorer.All
- Code.AccessAzureDataLake.All
- Code.AccessAzureKeyvault.All
- Code.AccessFabric.All
- Code.AccessStorage.All
- Lakehouse.Execute.All
- Lakehouse.ReadWrite.All
- Workspace.ReadWrite.All
- Notebook.ReadWrite.All
- SparkJobDefinition.ReadWrite.All
- MLModel.ReadWrite.All
- MLExperiment.ReadWrite.All
- Dataset.ReadWrite.All
Når du har registrert programmet, trenger du både program-ID-en (klient) og katalog-ID-en (leier).
Den godkjente brukeren som kaller Livy-API-en, må være et arbeidsområdemedlem der både API-en og datakildeelementene er plassert med en bidragsyterrolle. Hvis du vil ha mer informasjon, kan du se Gi brukere tilgang til arbeidsområder.
Slik oppdager du Fabric Livy API-endepunktet
En Lakehouse-artefakt er nødvendig for å få tilgang til Livy-endepunktet. Når Lakehouse er opprettet, kan Livy API-endepunktet være plassert i innstillingspanelet.
Endepunktet for Livy-API-en følger dette mønsteret:
https://api.fabric.microsoft.com/v1/workspaces/ < >ws_id/lakehouses/<lakehouse_id>/livyapi/versions/2023-12-01/
NETTADRESSEn legges til med økter <> eller <grupper>, avhengig av hva du velger.
Integrering med stoffmiljøer
For hvert Fabric-arbeidsområde klargjøres et standard startutvalg, kjøringen av all spark-koden bruker dette startutvalget som standard. Du kan bruke Stoffmiljøer til å tilpasse Livy API Spark-jobbene.
Last ned Livy API Swagger-filene
De fullstendige swagger-filene for Livy-API-en er tilgjengelige her.
Sende inn en Livy API-jobb
Nå som oppsettet av Livy-API-en er fullført, kan du velge å sende inn enten satsvise jobber eller øktjobber.
Slik overvåker du forespørselsloggen
Du kan bruke overvåkingshuben til å se dine tidligere Livy API-innsendinger, og feilsøke eventuelle innsendingsfeil.
Relatert innhold
- Apache Livy REST API-dokumentasjon
- Kom i gang med administrasjonsinnstillinger for stoffkapasiteten
- Administrasjonsinnstillinger for Apache Spark-arbeidsområdet i Microsoft Fabric
- Registrere et program med Microsofts identitetsplattform
- Microsoft Entra-tillatelse og samtykkeoversikt
- Rest-API-omfang for stoff
- Oversikt over Apache Spark-overvåking
- Apache Spark-programdetalj