Slik inntar du data i Fabric ved hjelp av Azure Data Factory Copy-aktiviteten
Microsoft Fabric Lakehouse-koblingen i Azure Data Factory (ADF) og Azure Synapse Analytics muliggjør både lese- og skriveoperasjoner til Microsoft Fabric Lakehouse (både for tabeller og filer). Denne koblingen gir deg muligheten til å bruke eksisterende ADF- og Synapse Pipelines og Mapping Data Flows til å samhandle med Fabric Lakehouses. Denne artikkelen hjelper deg med å konfigurere Microsoft Fabric til å tillate tjenestekontohavergodkjenning og demonstrerer deretter Lakehouse Connector for både lesing og skriving til Fabric Lakehouse.
Hvis du vil ha mer informasjon om Microsoft Fabric Lakehouse, kan du se Hva er et innsjøhus?
Azure Data Factory Lakehouse Connector
En ny Lakehouse-koblet tjenestekobling og to nye datasett er nå tilgjengelige for kunder som ønsker å begynne å lese fra og skrive til Microsoft Fabric Lakehouse. Hvis du vil ha en fullstendig veiledning om Lakehouse Connector, kan du se Kopiere og transformere data i Microsoft Fabric Lakehouse Files (forhåndsvisning).
Godkjenning
Azure Data Factory-koblet tjeneste
Microsoft Fabric Lakehouse-koblingen krever tjenestekontohaver (SPN)/appregistrering for godkjenning. For å komme i gang må du opprette en ny SPN eller bruke en eksisterende. Microsoft Fabric gir SPN-tilgang til bestemte sikkerhetsgrupper eller for hele organisasjonen. Hvis en bestemt sikkerhetsgruppe er alternativet organisasjonen bruker, må SPN-en som brukes i Lakehouse-koblingen, tilhøre en sikkerhetsgruppe som legges til i tillatelseslisten.
Notat
Power BI API-tillatelser (delegert) er ikke nødvendige
Tilgang til Power BI-API-er
Power BI-leieradministratoren må aktivere Tillat tjenestekontohavere å bruke Power BI API-erfra administrasjonsportalen for Power BI. Sikkerhetsgruppen må angis under Tillat tjenestekontohavere å bruke Power BI API-er innstilling, eller du kan aktivere for hele organisasjonen.
Hvis du vil ha en fullstendig veiledning, kan du se Bygg inn Power BI-innhold i et innebygd analyseprogram med tjenestekontohaver og en programhemmelighet.
Notat
Når du tilordner sikkerhetsgruppen til arbeidsområdet, kan det være en forsinkelse for tjenestekontohaveren å få tilgang til arbeidsområdet på grunn av hurtigbufring av tillatelser i Azure. Hvis du trenger umiddelbar tilgang, kan du bruke PowerShell til å fremtvinge en oppdatering av brukerens tillatelser. Dette gjør du ved å åpne PowerShell som administrator og deretter kjøre følgende kommandoer:
Install-Module -Name MicrosoftPowerBIMgmt
Connect-PowerBIServiceAccount -Tenant '<TENANT ID>' -ServicePrincipal -Credential (Get-Credential)
Get-PowerBIWorkspace
Invoke-PowerBIRestMethod -URL 'https://api.powerbi.com/v1.0/myorg/RefreshUserPermissions' -Method Post -Body ''
Get-PowerBIWorkspace
Arbeidsområdetilgang
Når sikkerhetsgruppen er lagt til, må sikkerhetsgruppen eller tjenestekontohaveren også legges til i hvert arbeidsområde som medlem, bidragsyter eller administrator. Se Gi brukere tilgang til arbeidsområder for mer informasjon.
Demonstrasjon: Konfigurere godkjenning
Tjenestekontohaver for appregistreringstjeneste
Opprett eller bruk en eksisterende tjenestekontohaver for appregistreringstjeneste (SPN). Følg trinnene i Registrere et program med Microsoft Entra ID og opprette en tjenestekontohaver.
Notat
Du trenger ikke å tilordne en omadresserings-URI.
Sikkerhetsgruppe
Opprett en ny Microsoft Entra-sikkerhetsgruppe, eller bruk en eksisterende, og legg deretter til SPN-en i den. Følg trinnene i Opprette en grunnleggende gruppe og legge til medlemmer for å opprette en Microsoft Entra Security Group.
Administrasjonsportal for Power BI
Gå til utviklerinnstillingene i administrasjonsportalen for Power BI, og velg Tillat tjenestekontohavere å bruke Power BI-API-er, og aktiver den. Legg deretter til sikkerhetsgruppen fra forrige trinn. Hvis du vil ha mer informasjon om leierinnstillingene for administrasjonsportalen for Power BI, kan du se leierinnstillinger.
Notat
Kontroller at innstillingen Brukere kan få tilgang til data som er lagret i OneLake med apper som er eksterne for Fabric er aktivert. Se Tillat at apper som kjører utenfor Fabric, får tilgang til data via OneLake.
Arbeidsområde
Legg til SPN eller tjenestegruppen i arbeidsområdet med medlem, bidragsytereller administrator tilgang.
Azure Data Factory: Koblet tjeneste
Opprett en ny Microsoft Fabric Lakehouse koblet tjeneste fra Azure Data Factory.
Notat
Hvis du vil finne arbeidsområdet og Lakehouse-ID-ene, går du til Fabric Lakehouse og identifiserer det fra nettadressen. Eksempel: https://.../groups/<Workspace ID>>/lakehouses/<Lakehouse ID>
Azure Data Factory: Datasett
Opprett et datasett som refererer til den koblede tjenesten Microsoft Fabric Lakehouse.
Notat
Velg Ingen for alternativet Importer skjema hvis tabellen ikke finnes ennå, og du angir manuelt et nytt tabellnavn.
Demo: Skriv til et Fabric Lakehouse-bord med en ADF-rørledning
Kilde
Opprett et nytt datasamlebånd og legg til en kopieringsaktivitet på datasamlebåndlerret. Velg et kildedatasett du vil flytte til en Lakehouse-tabell, fra fanen Kilde i kopieringsaktiviteten. I dette eksemplet refererer vi til en .csv fil fra en Azure Data Lake Storage (ADLS) Gen2-konto.
Vask
Gå til Kopier aktivitetens Sink-fanen, og velg Fabric Lakehouse-datasettet som ble opprettet tidligere.
Kjør datasamlebåndet
Kjør rørledningen for å flytte .csv data til Fabric Lakehouse-bordet.
Demo: Les fra et Fabric Lakehouse-bord med en ADF-rørledning
I delen ovenfor demonstrerte vi hvordan vi bruker ADF til å skrive til et Fabric Lakehouse Table. La oss nå lese fra et Fabric Lakehouse Table og skrive til en Parquet-fil i Azure Data Lake Storage (ADLS) Gen2 med en lignende rørledning.
Kilde
Opprett et nytt datasamlebånd og legg til en kopieringsaktivitet på datasamlebåndlerret. Velg Fabric Lakehouse-datasettet som ble opprettet tidligere, fra fanen Kilde i Kopier-aktiviteten.
Vask
Gå til kopier aktivitetens Synke-fanen, og velg måldatasettet. I dette eksemplet er målet Azure Data Lake Storage (Gen2), som en parkettfil.
Kjør datasamlebåndet
Kjør datasamlebåndet for å flytte dataene fra Fabric Lakehouse-tabellen til Parquet-filen i ADLS Gen2.
Undersøk Parquet-filen i ADLS Gen2
Dataene fra Fabric Lakehouse-tabellen er nå tilgjengelig i ADLS Gen2 som en Parquet-fil.
Sammendrag
I denne delen utforsket vi kravene for Lakehouse Connector ved hjelp av tjenestekontohavergodkjenning til et Microsoft Fabric Lakehouse, og gikk deretter gjennom et eksempel for både lesing og skriving til Lakehouse fra en Azure Data Factory-rørledning. Denne koblingen og funksjonene er også tilgjengelige i dataflyter for azure datafabrikktilordning, Azure Synapse Analytics og Azure Synapse Analytics Mapping Data Flows.