Del via


Sådan indfødning af data til Fabric ved hjælp af Azure Data Factory Copy-aktiviteten

Microsoft Fabric Lakehouse-connectoren i Azure Data Factory (ADF) og Azure Synapse Analytics muliggør både læse- og skrivehandlinger til Microsoft Fabric Lakehouse (både til tabeller og filer). Denne connector giver dig mulighed for at bruge dine eksisterende ADF- og Synapse-pipelines og kortlægningsdataflows til at interagere med Fabric Lakehouses. Denne artikel hjælper dig med at konfigurere Microsoft Fabric til at tillade godkendelse af tjenesteprincipaler og viser derefter Lakehouse Connector til både læsning og skrivning til Fabric Lakehouse.

Du kan få flere oplysninger om Microsoft Fabric Lakehouse under Hvad er et lakehouse?

Azure Data Factory Lakehouse Connector

En ny Lakehouse-sammenkædet serviceconnector og to nye datasæt er nu tilgængelige for kunder, der vil begynde at læse fra og skrive til Microsoft Fabric Lakehouse. Du kan finde en komplet vejledning til Lakehouse Connector i Kopiér og transformér data i Microsoft Fabric Lakehouse Files (prøveversion).

Godkendelse

Azure Data Factory-sammenkædet tjeneste

Microsoft Fabric Lakehouse-connectoren kræver en tjenesteprincipal (SPN)/appregistrering til godkendelse. Hvis du vil i gang, skal du oprette et nyt SPN eller bruge et eksisterende. Microsoft Fabric giver SPN adgang til enten bestemte sikkerhedsgrupper eller til hele organisationen. Hvis en bestemt sikkerhedsgruppe er den indstilling, din organisation bruger, skal det SPN, der bruges i Lakehouse-connectoren, tilhøre en sikkerhedsgruppe, der føjes til listen over tilladte.

Seddel

Power BI API-tilladelser (delegerede) er ikke nødvendige

Adgang til Power BI-API'er

Fra Power BI-administrationsportalen skal Power BI-lejeradministratoren aktivere Tillad tjenesteprincipaler at bruge Power BI-API'er. Sikkerhedsgruppen skal angives under indstillingen Tillad, at tjenesteprincipaler bruger Power BI-API'er indstilling, eller du kan aktivere for hele organisationen.

Du kan finde en komplet vejledning i Integrer Power BI-indhold i et integreret analyseprogram med en tjenesteprincipal og en programhemmelighed.

Seddel

Når sikkerhedsgruppen tildeles til arbejdsområdet, kan der være en forsinkelse i, at tjenesteprincipalen tildeles adgang til arbejdsområdet pga. cachelagring af tilladelser i Azure. Hvis du har brug for øjeblikkelig adgang, kan du bruge PowerShell til at gennemtvinge en opdatering af brugerens tilladelser. Det gør du ved at åbne PowerShell som administrator og derefter køre følgende kommandoer:

Install-Module -Name MicrosoftPowerBIMgmt
Connect-PowerBIServiceAccount -Tenant '<TENANT ID>' -ServicePrincipal -Credential (Get-Credential)
Get-PowerBIWorkspace
Invoke-PowerBIRestMethod -URL 'https://api.powerbi.com/v1.0/myorg/RefreshUserPermissions' -Method Post -Body ''
Get-PowerBIWorkspace

Adgang til arbejdsområde

Når sikkerhedsgruppen er tilføjet, skal sikkerhedsgruppen eller tjenesteprincipalen også føjes til hvert arbejdsområde som medlem, bidragyder eller administrator. Se Giv brugere adgang til arbejdsområder for at få flere oplysninger.

Demo: Konfigurer godkendelse

Tjenesteprincipal for appregistrering

Opret eller brug en eksisterende tjenesteprincipal for appregistrering. Følg trinnene i Registrer et program med Microsoft Entra ID, og opret en tjenesteprincipal.

Seddel

Du behøver ikke at tildele en omdirigerings-URI.

Skærmbillede, der viser detaljerne for en ny tjenesteprincipal.

Sikkerhedsgruppe

Opret en ny Microsoft Entra-sikkerhedsgruppe, eller brug en eksisterende, og føj derefter SPN'et til den. Følg trinnene i Opret en grundlæggende gruppe, og tilføj medlemmer for at oprette en Microsoft Entra-sikkerhedsgruppe.

Skærmbillede, der viser, hvor medlemmer skal føjes til en sikkerhedsgruppe.

Power BI-administrationsportal

Gå til Indstillinger for udvikler på Power BI-administrationsportal, og vælg Tillad, at tjenesteprincipaler bruger Power BI-API'er, og aktivér det derefter. Tilføj derefter sikkerhedsgruppen fra det forrige trin. Du kan få flere oplysninger om lejerindstillingerne for Power BI-administrationsportalen under Lejerindstillinger.

Skærmbillede, der viser Power BI-administrationsportalen med indstillingen Tillad, at tjenesteprincipaler bruger Power BI API'er udvidet og aktiveret.

Seddel

Sørg for, at indstillingen Brugere kan få adgang til data, der er gemt i OneLake, med apps uden for Fabric er aktiveret. Se Tillad, at apps, der kører uden for Fabric, får adgang til data via OneLake.

Arbejdsområde

Føj SPN'et eller tjenestegruppen til arbejdsområdet med , Bidragydereller administrator adgang.

Azure Data Factory: Sammenkædet tjeneste

Fra Azure Data Factoryskal du oprette en ny Microsoft Fabric Lakehouse sammenkædet tjeneste.

Seddel

Hvis du vil finde arbejdsområdet og Lakehouse-id'erne, skal du navigere til dit Fabric Lakehouse og identificere det fra URL-adressen. For eksempel: https://.../groups/<Arbejdsområde-id>>/lakehouses/<Lakehouse ID>

Azure Data Factory: Datasæt

Opret et datasæt, der refererer til den sammenkædede tjeneste Microsoft Fabric Lakehouse.

Seddel

Vælg Ingen for indstillingen Importér skema, hvis tabellen ikke findes endnu, og du manuelt angiver et nyt tabelnavn.

Skærmbillede, der viser dialogboksen Nyt datasæt med datasættypen Microsoft Fabric Lakehouse Table valgt.

Skærmbillede, der viser dialogboksen Med egenskaber for datasæt, hvor indstillingen Importér skema er angivet til Ingen.

Demo: Skriv til et Fabric Lakehouse-bord med en ADF-pipeline

Kilde

Opret en ny pipeline, og føj en kopiaktivitet til pipelinelærredet. På fanen Kilde under fanen Kopiér aktivitet skal du vælge et kildedatasæt, du vil flytte til en Lakehouse-tabel. I dette eksempel refererer vi til en .csv-fil fra en ADLS-konto (Azure Data Lake Storage) Gen2.

Skærmbillede, der viser konfigurationen af fanen Kildeindstillinger for en kopiaktivitet med en .csv valgt for kildedatasættet.

Synke

Gå til fanen Kopiér aktivitets Sink, og vælg det Fabric Lakehouse-datasæt, der blev oprettet tidligere.

Skærmbillede, der viser valget af det Fabric Lakehouse-datasæt, der blev oprettet tidligere.

Kør pipelinen

Kør pipelinen for at flytte de .csv data til tabellen Fabric Lakehouse.

Skærmbillede, der viser resultatet af at køre pipelinen.

Demo: Læs fra et Fabric Lakehouse-bord med en ADF-rørledning

I ovenstående afsnit viste vi, hvordan du bruger ADF til at skrive til en Fabric Lakehouse Table. Lad os nu læse fra en Fabric Lakehouse-tabel og skrive til en Parquet-fil i Azure Data Lake Storage (ADLS) Gen2 med en lignende pipeline.

Kilde

Opret en ny pipeline, og føj en kopiaktivitet til pipelinelærredet. Vælg det Fabric Lakehouse-datasæt, der blev oprettet tidligere, på fanen Kilde under fanen Kopiér aktivitet.

Skærmbillede, der viser valget og prøveversionen af den Lakehouse-datakilde, der blev oprettet tidligere.

Synke

Gå til fanen Kopiér aktivitets Sink, og vælg destinationsdatasættet. I dette eksempel er destinationen Azure Data Lake Storage (Gen2) som en Parquet-fil.

Skærmbillede, der viser valget af en ADLS Gen2-vask.

Kør pipelinen

Kør pipelinen for at flytte dataene fra tabellen Fabric Lakehouse til Parquet-filen i ADLS Gen2.

Skærmbillede, der viser resultatet af at køre pipelinen for at importere data til ADLS Gen2 fra en Fabric Lakehouse.

Undersøg parquetfilen i ADLS Gen2

Dataene fra tabellen Fabric Lakehouse er nu tilgængelige i ADLS Gen2 som en parquetfil.

Skærmbillede, der viser den Parquet-fil, der genereres af pipelinen.

Resumé

I dette afsnit udforskede vi kravene til Lakehouse Connector ved hjælp af godkendelse af tjenesteprincipal til en Microsoft Fabric Lakehouse og gennemgik derefter et eksempel til både læsning og skrivning til Lakehouse fra en Azure Data Factory-pipeline. Denne connector og disse funktioner er også tilgængelige i Azure Data Factory Mapping Data Flows, Azure Synapse Analytics og Azure Synapse Analytics Mapping Data Flows.

dokumentation til Azure Data Factory