Co to są schematy usługi Lakehouse (wersja zapoznawcza)?
Usługa Lakehouse obsługuje tworzenie schematów niestandardowych. Schematy umożliwiają grupowanie tabel w celu lepszego odnajdywania danych, kontroli dostępu i nie tylko.
Tworzenie schematu lakehouse
Aby włączyć obsługę schematu dla usługi Lakehouse, zaznacz pole wyboru obok pozycji Schematy usługi Lakehouse (publiczna wersja zapoznawcza) podczas jego tworzenia.
Ważne
Nazwy obszarów roboczych mogą zawierać tylko znaki alfanumeryczne ze względu na ograniczenia wersji zapoznawczej. Jeśli znaki specjalne są używane w nazwach obszarów roboczych, niektóre funkcje usługi Lakehouse nie będą działać.
Po utworzeniu magazynu lakehouse można znaleźć domyślny schemat o nazwie dbo w obszarze Tabele. Ten schemat jest zawsze dostępny i nie można go zmienić ani usunąć. Aby utworzyć nowy schemat, umieść kursor nad tabelami, wybierz pozycję ..., a następnie wybierz pozycję Nowy schemat. Wprowadź nazwę schematu i wybierz pozycję Utwórz. Schemat zostanie wyświetlony w obszarze Tabele w kolejności alfabetycznej.
Przechowywanie tabel w schematach lakehouse
Do przechowywania tabeli w schemacie potrzebna jest nazwa schematu. W przeciwnym razie przechodzi do domyślnego schematu dbo .
df.write.mode("Overwrite").saveAsTable("contoso.sales")
Eksplorator usługi Lakehouse umożliwia rozmieszczenie tabel i przeciąganie i upuszczanie nazw tabel do różnych schematów.
Uwaga
Jeśli zmodyfikujesz tabelę, musisz również zaktualizować powiązane elementy, takie jak kod notesu lub przepływy danych, aby upewnić się, że są one dopasowane do poprawnego schematu.
Używanie wielu tabel ze skrótem do schematu
Aby odwołać się do wielu tabel różnicowych z innej usługi Fabric Lakehouse lub magazynu zewnętrznego, użyj skrótu schematu, który wyświetla wszystkie tabele w wybranym schemacie lub folderze. Wszelkie zmiany w tabelach w lokalizacji źródłowej również są wyświetlane w schemacie. Aby utworzyć skrót schematu, umieść kursor nad tabelami, wybierz pozycję ..., a następnie wybierz pozycję Nowy skrót schematu. Następnie wybierz schemat w innym magazynie typu lakehouse lub folder z tabelami delty w magazynie zewnętrznym, takimi jak Azure Data Lake Storage (ADLS) Gen2. Spowoduje to utworzenie nowego schematu z przywołynymi tabelami.
Uzyskiwanie dostępu do schematów usługi Lakehouse na potrzeby raportowania usługi Power BI
Aby utworzyć model semantyczny, wystarczy wybrać tabele, których chcesz użyć. Tabele mogą znajdować się w różnych schematach. Jeśli tabele z różnych schematów mają taką samą nazwę, numery są wyświetlane obok nazw tabel w widoku modelu.
Schematy usługi Lakehouse w notesie
Po zapoznaniu się ze schematem z włączoną usługą Lakehouse w eksploratorze obiektów notesu tabele znajdują się w schematach. Tabelę można przeciągać i upuszczać do komórki kodu i pobierać fragment kodu odwołujący się do schematu, w którym znajduje się tabela. Użyj tej przestrzeni nazw, aby odwołać się do tabel w kodzie: "workspace.lakehouse.schema.table". Jeśli wyjedziesz z któregokolwiek z elementów, funkcja wykonawcza używa ustawienia domyślnego. Jeśli na przykład nadasz nazwę tabeli, używa domyślnego schematu (dbo) z domyślnego magazynu lakehouse dla notesu.
Ważne
Jeśli chcesz użyć schematów w kodzie, upewnij się, że domyślny magazyn lakehouse dla notesu jest włączony schemat.
Zapytania Spark SQL między obszarami roboczymi
Użyj przestrzeni nazw "workspace.lakehouse.schema.table", aby odwołać się do tabel w kodzie. W ten sposób można łączyć tabele z różnych obszarów roboczych, jeśli użytkownik, który uruchamia kod, ma uprawnienia dostępu do tabel.
SELECT *
FROM operations.hr.hrm.employees as employees
INNER JOIN global.corporate.company.departments as departments
ON employees.deptno = departments.deptno;
Ważne
Upewnij się, że tabele są przyłączane tylko z magazynów lakehouse, które mają włączone schematy. Łączenie tabel z magazynów lakehouse, które nie mają włączonych schematów, nie będzie działać.
Ograniczenia publicznej wersji zapoznawczej
Poniżej wymieniono nieobsługiwane funkcje/funkcje dla bieżącej wersji publicznej wersji zapoznawczej. Zostaną one rozwiązane w nadchodzących wersjach przed ogólną dostępnością.
Nieobsługiwane funkcje/funkcje | Uwagi |
---|---|
Udostępnione jezioro | Użycie obszaru roboczego w przestrzeni nazw dla udostępnionych magazynów lakehouse nie będzie działać, np. wokrkspace.sharedlakehouse.schema.table. Aby można było używać obszaru roboczego w przestrzeni namaspace, użytkownik musi mieć rolę obszaru roboczego. |
Schemat tabeli innej niż delta, schemat tabeli zarządzanej | Pobieranie schematu dla zarządzanych tabel sformatowanych poza delty (na przykład CSV) nie jest obsługiwane. Rozwinięcie tych tabel w eksploratorze lakehouse nie pokazuje żadnych informacji o schemacie w środowisku użytkownika. |
Tabele zewnętrzne platformy Spark | Zewnętrzne operacje tabel platformy Spark (na przykład odnajdywanie, pobieranie schematu itp.) nie są obsługiwane. Te tabele są niezidentyfikowane w środowisku użytkownika. |
Publiczny interfejs API | Publiczne interfejsy API (tabele list, ładowanie tabeli, uwidacznianie domyślnej właściwości rozszerzonej programu Lakehouse itp.) nie są obsługiwane w przypadku usługi Lakehouse z włączoną obsługą schematu. Istniejące publiczne interfejsy API wywoływane w schemacie z włączoną usługą Lakehouse powoduje wystąpienie błędu. |
Konserwacja tabeli | Nieobsługiwane. |
Aktualizowanie właściwości tabeli | Nieobsługiwane. |
Nazwa obszaru roboczego zawierająca znaki specjalne | Obszar roboczy ze znakami specjalnymi (na przykład spacją, ukośnikami) nie jest obsługiwany. Zostanie wyświetlony błąd użytkownika. |
Widoki platformy Spark | Nieobsługiwane. |
Funkcje specyficzne dla programu Hive | Nieobsługiwane. |
Spark.catalog API | Nieobsługiwane. Zamiast tego użyj usługi Spark SQL. |
USE <schemaName> |
Nie działa między obszarami roboczymi, ale jest obsługiwany w tym samym obszarze roboczym. |
Migracja | Migracja istniejących usług Lakehouse innych niż schemat do usług Lakehouse opartych na schemacie nie jest obsługiwana. |