Jak przesyłać dane do Fabric przy użyciu działania Kopiowanie w usłudze Azure Data Factory
Łącznik usługi Microsoft Fabric Lakehouse w usłudze Azure Data Factory (ADF) i usłudze Azure Synapse Analytics umożliwia operacje odczytu i zapisu w usłudze Microsoft Fabric Lakehouse (zarówno dla tabel, jak i plików). Ten łącznik umożliwia korzystanie z istniejących potoków usług ADF i Synapse oraz przepływów mapowania danych w celu interakcji z usługą Fabric Lakehouse. Ten artykuł pomaga skonfigurować usługę Microsoft Fabric tak, aby zezwalała na uwierzytelnianie jednostki usługi, a następnie demonstruje łącznik Lakehouse na potrzeby odczytu i zapisu w usłudze Fabric Lakehouse.
Aby uzyskać więcej informacji na temat usługi Microsoft Fabric Lakehouse, zobacz Co to jest jezioro?
Łącznik usługi Azure Data Factory Lakehouse
Teraz dostępne są nowy łącznik usługi połączonej Lakehouse i dwa nowe zestawy danych dla klientów, którzy chcą rozpocząć czytanie i zapisywanie w usłudze Microsoft Fabric Lakehouse. Aby zapoznać się z pełnym przewodnikiem dotyczącym łącznika Lakehouse, odnieś się do artykułu Copy and transform data in Microsoft Fabric Lakehouse Files (Preview).
Uwierzytelnianie
Połączona usługa Azure Data Factory
Łącznik Microsoft Fabric Lakehouse wymaga rejestracji głównej usługi (SPN)/aplikacji do uwierzytelniania. Aby rozpocząć, musisz utworzyć nowy SPN lub użyć istniejącego. Usługa Microsoft Fabric umożliwia dostęp za pomocą SPN do określonych grup zabezpieczeń lub całej organizacji. Jeśli określona grupa zabezpieczeń jest opcją używaną przez organizację, to SPN używany w łączniku Lakehouse musi należeć do grupy zabezpieczeń, która jest dodana do listy dozwolonych.
Nota
Uprawnienia API Power BI (delegowane) nie są potrzebne
Dostęp do interfejsów API usługi Power BI
W portalu administracyjnym usługi Power BI administrator dzierżawy usługi Power BI musi włączyć Zezwalaj jednostkom usługi na używanie interfejsów API usługi Power BI. Grupa zabezpieczeń musi być określona w obszarze ustawień Zezwalaj jednostkom usługi na korzystanie z interfejsów API usługi Power BI lub można to włączyć dla całej organizacji.
Aby uzyskać pełny przewodnik, zobacz Osadzanie zawartości usługi Power BI w osadzonej aplikacji analitycznej przy użyciu jednostki usługi i klucza tajnego aplikacji.
Notatka
Podczas przypisywania grupy zabezpieczeń do obszaru roboczego może wystąpić opóźnienie, aby jednostka usługi otrzymała dostęp do obszaru roboczego z powodu buforowania uprawnień na platformie Azure. Jeśli potrzebujesz natychmiastowego dostępu, możesz użyć programu PowerShell, aby wymusić odświeżenie uprawnień użytkownika. W tym celu otwórz program PowerShell jako administrator, a następnie uruchom następujące polecenia:
Install-Module -Name MicrosoftPowerBIMgmt
Connect-PowerBIServiceAccount -Tenant '<TENANT ID>' -ServicePrincipal -Credential (Get-Credential)
Get-PowerBIWorkspace
Invoke-PowerBIRestMethod -URL 'https://api.powerbi.com/v1.0/myorg/RefreshUserPermissions' -Method Post -Body ''
Get-PowerBIWorkspace
Dostęp do obszaru roboczego
Po dodaniu grupy zabezpieczeń należy również dodać grupę zabezpieczeń lub jednostkę usługi do każdego obszaru roboczego jako członek, współautor lub administrator. Aby uzyskać więcej informacji, zobacz Przyznawanie użytkownikom dostępu do obszarów roboczych.
Pokaz: Konfigurowanie uwierzytelniania
Jednostka usługi rejestracji aplikacji
Utwórz lub użyj istniejącej jednostki usługi rejestracji aplikacji (SPN). Wykonaj kroki opisane w Rejestrowanie aplikacji przy użyciu identyfikatora Microsoft Entra ID i utwórz jednostkę usługi.
Notatka
Nie trzeba ustawiać identyfikatora URI przekierowania.
Grupa zabezpieczeń
Utwórz nową grupę zabezpieczeń firmy Microsoft Entra lub użyj istniejącej, a następnie dodaj do niej nazwę SPN. Wykonaj kroki opisane w Tworzenie podstawowej grupy i dodaj członków, aby utworzyć grupę zabezpieczeń firmy Microsoft Entra.
Portal administracyjny usługi Power BI
W portalu administracyjnym usługi Power BIprzejdź do sekcji Ustawienia programisty, wybierz pozycję Zezwalaj jednostkom usługi na używanie interfejsów API usługi Power BI, a następnie włącz tę opcję. Następnie dodaj grupę zabezpieczeń z poprzedniego kroku. Aby uzyskać więcej informacji na temat ustawień dzierżawy portalu administracyjnego usługi Power BI, zobacz Ustawienia dzierżawy.
Notatka
Upewnij się, że ustawienie Użytkownicy mogą uzyskiwać dostęp do danych przechowywanych w usłudze OneLake przy użyciu aplikacji zewnętrznych wobec Fabric jest włączone. Zobacz Zezwalaj aplikacjom działającym poza platformą Fabric na dostęp do danych za pośrednictwem usługi OneLake.
Obszar roboczy
Dodaj SPN lub grupę usług do obszaru roboczego z dostępem jako Członek , Współautor lub Administrator .
Azure Data Factory: połączona usługa
W Azure Data Factoryutwórz nową połączoną usługę Microsoft Fabric Lakehouse.
Notatka
Aby znaleźć obszar roboczy i identyfikatory usługi Lakehouse, przejdź do usługi Fabric Lakehouse i zidentyfikuj go z adresu URL. Na przykład: https://.../groups/<ID obszaru roboczego>>/lakehouses/<ID Lakehouse>
Azure Data Factory: zestaw danych
Utwórz zestaw danych, który odwołuje się do połączonej usługi Microsoft Fabric Lakehouse.
Notatka
Wybierz opcję Brak dla opcji Importuj schemat, jeśli tabela jeszcze nie istnieje i ręcznie określasz nową nazwę tabeli.
Demonstracja: zapisywanie do tabeli w Fabric Lakehouse przy użyciu potoku ADF
Źródło
Utwórz nowy potok i dodaj działanie Kopiowania do kanwy potoku. Na karcie Source (Źródło) działania Kopiowanie, wybierz zestaw danych, który chcesz przenieść do tabeli Lakehouse. W tym przykładzie odwołujemy się do pliku .csv z konta usługi Azure Data Lake Storage (ADLS) Gen2.
Zlew
Przejdź do karty wyjścia w aktywności kopiowania i wybierz wcześniej utworzony zestaw danych Fabric Lakehouse.
Uruchamianie potoku
Uruchom potok, aby przenieść dane .csv do tabeli Fabric Lakehouse.
Demonstracja: odczytywanie z tabeli Fabric Lakehouse za pomocą przepływu ADF
W powyższej sekcji pokazaliśmy, jak używać ADF do zapisywania w tabeli Fabric Lakehouse. Teraz odczytajmy tabelę Usługi Fabric Lakehouse i zapiszmy w pliku Parquet w usłudze Azure Data Lake Storage (ADLS) Gen2 z podobnym potokiem.
Źródło
Utwórz nowy potok i dodaj działanie Kopiowania do kanwy potoku. Na karcie Źródło działania kopiowania wybierz utworzony wcześniej zestaw danych usługi Fabric Lakehouse.
Zlew
Przejdź do karty ujścia działania kopiowania i wybierz docelowy zestaw danych. W tym przykładzie miejscem docelowym jest usługa Azure Data Lake Storage (Gen2) jako plik Parquet.
Uruchom potok danych
Uruchom potok, aby przenieść dane z tabeli Fabric Lakehouse do pliku Parquet w usłudze ADLS Gen2.
Sprawdź plik Parquet w usłudze ADLS Gen2
Dane z tabeli Fabric Lakehouse są teraz dostępne w usłudze ADLS Gen2 jako plik Parquet.
Streszczenie
W tej sekcji zapoznaliśmy się z wymaganiami stawianymi przed łącznikiem Lakehouse, przy użyciu uwierzytelniania jednostki usługi w Microsoft Fabric Lakehouse, a następnie przeanalizowaliśmy przykład dotyczący zarówno odczytu, jak i zapisu w Lakehouse, z potoku usługi Azure Data Factory. Ten łącznik i możliwości są również dostępne w przepływach danych mapowania usługi Azure Data Factory, usłudze Azure Synapse Analytics i przepływach danych mapowania usługi Azure Synapse Analytics.