Udostępnij za pośrednictwem


Jak przesyłać dane do Fabric przy użyciu działania Kopiowanie w usłudze Azure Data Factory

Łącznik usługi Microsoft Fabric Lakehouse w usłudze Azure Data Factory (ADF) i usłudze Azure Synapse Analytics umożliwia operacje odczytu i zapisu w usłudze Microsoft Fabric Lakehouse (zarówno dla tabel, jak i plików). Ten łącznik umożliwia korzystanie z istniejących potoków usług ADF i Synapse oraz przepływów mapowania danych w celu interakcji z usługą Fabric Lakehouse. Ten artykuł pomaga skonfigurować usługę Microsoft Fabric tak, aby zezwalała na uwierzytelnianie jednostki usługi, a następnie demonstruje łącznik Lakehouse na potrzeby odczytu i zapisu w usłudze Fabric Lakehouse.

Aby uzyskać więcej informacji na temat usługi Microsoft Fabric Lakehouse, zobacz Co to jest jezioro?

Łącznik usługi Azure Data Factory Lakehouse

Teraz dostępne są nowy łącznik usługi połączonej Lakehouse i dwa nowe zestawy danych dla klientów, którzy chcą rozpocząć czytanie i zapisywanie w usłudze Microsoft Fabric Lakehouse. Aby zapoznać się z pełnym przewodnikiem dotyczącym łącznika Lakehouse, odnieś się do artykułu Copy and transform data in Microsoft Fabric Lakehouse Files (Preview).

Uwierzytelnianie

Połączona usługa Azure Data Factory

Łącznik Microsoft Fabric Lakehouse wymaga rejestracji głównej usługi (SPN)/aplikacji do uwierzytelniania. Aby rozpocząć, musisz utworzyć nowy SPN lub użyć istniejącego. Usługa Microsoft Fabric umożliwia dostęp za pomocą SPN do określonych grup zabezpieczeń lub całej organizacji. Jeśli określona grupa zabezpieczeń jest opcją używaną przez organizację, to SPN używany w łączniku Lakehouse musi należeć do grupy zabezpieczeń, która jest dodana do listy dozwolonych.

Nota

Uprawnienia API Power BI (delegowane) nie są potrzebne

Dostęp do interfejsów API usługi Power BI

W portalu administracyjnym usługi Power BI administrator dzierżawy usługi Power BI musi włączyć Zezwalaj jednostkom usługi na używanie interfejsów API usługi Power BI. Grupa zabezpieczeń musi być określona w obszarze ustawień Zezwalaj jednostkom usługi na korzystanie z interfejsów API usługi Power BI lub można to włączyć dla całej organizacji.

Aby uzyskać pełny przewodnik, zobacz Osadzanie zawartości usługi Power BI w osadzonej aplikacji analitycznej przy użyciu jednostki usługi i klucza tajnego aplikacji.

Notatka

Podczas przypisywania grupy zabezpieczeń do obszaru roboczego może wystąpić opóźnienie, aby jednostka usługi otrzymała dostęp do obszaru roboczego z powodu buforowania uprawnień na platformie Azure. Jeśli potrzebujesz natychmiastowego dostępu, możesz użyć programu PowerShell, aby wymusić odświeżenie uprawnień użytkownika. W tym celu otwórz program PowerShell jako administrator, a następnie uruchom następujące polecenia:

Install-Module -Name MicrosoftPowerBIMgmt
Connect-PowerBIServiceAccount -Tenant '<TENANT ID>' -ServicePrincipal -Credential (Get-Credential)
Get-PowerBIWorkspace
Invoke-PowerBIRestMethod -URL 'https://api.powerbi.com/v1.0/myorg/RefreshUserPermissions' -Method Post -Body ''
Get-PowerBIWorkspace

Dostęp do obszaru roboczego

Po dodaniu grupy zabezpieczeń należy również dodać grupę zabezpieczeń lub jednostkę usługi do każdego obszaru roboczego jako członek, współautor lub administrator. Aby uzyskać więcej informacji, zobacz Przyznawanie użytkownikom dostępu do obszarów roboczych.

Pokaz: Konfigurowanie uwierzytelniania

Jednostka usługi rejestracji aplikacji

Utwórz lub użyj istniejącej jednostki usługi rejestracji aplikacji (SPN). Wykonaj kroki opisane w Rejestrowanie aplikacji przy użyciu identyfikatora Microsoft Entra ID i utwórz jednostkę usługi.

Notatka

Nie trzeba ustawiać identyfikatora URI przekierowania.

Zrzut ekranu przedstawiający szczegóły nowego pryncypała usługi.

Grupa zabezpieczeń

Utwórz nową grupę zabezpieczeń firmy Microsoft Entra lub użyj istniejącej, a następnie dodaj do niej nazwę SPN. Wykonaj kroki opisane w Tworzenie podstawowej grupy i dodaj członków, aby utworzyć grupę zabezpieczeń firmy Microsoft Entra.

zrzut ekranu przedstawiający miejsce dodawania członków do grupy zabezpieczeń.

Portal administracyjny usługi Power BI

W portalu administracyjnym usługi Power BIprzejdź do sekcji Ustawienia programisty, wybierz pozycję Zezwalaj jednostkom usługi na używanie interfejsów API usługi Power BI, a następnie włącz tę opcję. Następnie dodaj grupę zabezpieczeń z poprzedniego kroku. Aby uzyskać więcej informacji na temat ustawień dzierżawy portalu administracyjnego usługi Power BI, zobacz Ustawienia dzierżawy.

Zrzut ekranu przedstawiający portal administracyjny usługi Power BI z rozszerzoną i włączoną opcją pozwalającą jednostkom usługi na korzystanie z interfejsów API usługi Power BI.

Notatka

Upewnij się, że ustawienie Użytkownicy mogą uzyskiwać dostęp do danych przechowywanych w usłudze OneLake przy użyciu aplikacji zewnętrznych wobec Fabric jest włączone. Zobacz Zezwalaj aplikacjom działającym poza platformą Fabric na dostęp do danych za pośrednictwem usługi OneLake.

Obszar roboczy

Dodaj SPN lub grupę usług do obszaru roboczego z dostępem jako Członek , Współautor lub Administrator .

Azure Data Factory: połączona usługa

W Azure Data Factoryutwórz nową połączoną usługę Microsoft Fabric Lakehouse.

Notatka

Aby znaleźć obszar roboczy i identyfikatory usługi Lakehouse, przejdź do usługi Fabric Lakehouse i zidentyfikuj go z adresu URL. Na przykład: https://.../groups/<ID obszaru roboczego>>/lakehouses/<ID Lakehouse>

Azure Data Factory: zestaw danych

Utwórz zestaw danych, który odwołuje się do połączonej usługi Microsoft Fabric Lakehouse.

Notatka

Wybierz opcję Brak dla opcji Importuj schemat, jeśli tabela jeszcze nie istnieje i ręcznie określasz nową nazwę tabeli.

Zrzut ekranu przedstawiający okno dialogowe Nowy zestaw danych z wybranym typem zestawu danych Microsoft Fabric Lakehouse Table.

Zrzut ekranu przedstawiający okno dialogowe Ustawianie właściwości zestawu danych z opcją Importuj schemat ustawiony na Wartość Brak.

Demonstracja: zapisywanie do tabeli w Fabric Lakehouse przy użyciu potoku ADF

Źródło

Utwórz nowy potok i dodaj działanie Kopiowania do kanwy potoku. Na karcie Source (Źródło) działania Kopiowanie, wybierz zestaw danych, który chcesz przenieść do tabeli Lakehouse. W tym przykładzie odwołujemy się do pliku .csv z konta usługi Azure Data Lake Storage (ADLS) Gen2.

Zrzut ekranu przedstawiający konfigurację karty Ustawienia źródła działania kopiowania z .csv wybraną dla źródłowego zestawu danych.

Zlew

Przejdź do karty wyjścia w aktywności kopiowania i wybierz wcześniej utworzony zestaw danych Fabric Lakehouse.

Zrzut ekranu przedstawiający wybór utworzonego wcześniej zestawu danych usługi Fabric Lakehouse.

Uruchamianie potoku

Uruchom potok, aby przenieść dane .csv do tabeli Fabric Lakehouse.

Zrzut ekranu przedstawiający wynik uruchomienia potoku.

Demonstracja: odczytywanie z tabeli Fabric Lakehouse za pomocą przepływu ADF

W powyższej sekcji pokazaliśmy, jak używać ADF do zapisywania w tabeli Fabric Lakehouse. Teraz odczytajmy tabelę Usługi Fabric Lakehouse i zapiszmy w pliku Parquet w usłudze Azure Data Lake Storage (ADLS) Gen2 z podobnym potokiem.

Źródło

Utwórz nowy potok i dodaj działanie Kopiowania do kanwy potoku. Na karcie Źródło działania kopiowania wybierz utworzony wcześniej zestaw danych usługi Fabric Lakehouse.

Zrzut ekranu przedstawiający wybór i podgląd utworzonego wcześniej źródła danych usługi Lakehouse.

Zlew

Przejdź do karty ujścia działania kopiowania i wybierz docelowy zestaw danych. W tym przykładzie miejscem docelowym jest usługa Azure Data Lake Storage (Gen2) jako plik Parquet.

Zrzut ekranu przedstawiający wybór punktu końcowego usługi ADLS Gen2.

Uruchom potok danych

Uruchom potok, aby przenieść dane z tabeli Fabric Lakehouse do pliku Parquet w usłudze ADLS Gen2.

Zrzut ekranu przedstawiający wynik działania potoku importującego dane do ADLS Gen2 z Fabric Lakehouse.

Sprawdź plik Parquet w usłudze ADLS Gen2

Dane z tabeli Fabric Lakehouse są teraz dostępne w usłudze ADLS Gen2 jako plik Parquet.

Zrzut ekranu przedstawiający plik Parquet wygenerowany przez potok.

Streszczenie

W tej sekcji zapoznaliśmy się z wymaganiami stawianymi przed łącznikiem Lakehouse, przy użyciu uwierzytelniania jednostki usługi w Microsoft Fabric Lakehouse, a następnie przeanalizowaliśmy przykład dotyczący zarówno odczytu, jak i zapisu w Lakehouse, z potoku usługi Azure Data Factory. Ten łącznik i możliwości są również dostępne w przepływach danych mapowania usługi Azure Data Factory, usłudze Azure Synapse Analytics i przepływach danych mapowania usługi Azure Synapse Analytics.

Dokumentacja Azure Data Factory