Vad är Lakehouse-scheman (förhandsversion)?
Lakehouse stöder skapandet av anpassade scheman. Med scheman kan du gruppera tabellerna för bättre dataidentifiering, åtkomstkontroll med mera.
Skapa ett lakehouse-schema
Om du vill aktivera schemastöd för ditt lakehouse markerar du kryssrutan bredvid Lakehouse-scheman (offentlig förhandsversion) när du skapar det.
Viktigt!
Arbetsytenamn får endast innehålla alfanumeriska tecken på grund av förhandsgranskningsbegränsningar. Om specialtecken används i arbetsytenamn fungerar inte vissa Lakehouse-funktioner.
När du har skapat lakehouse hittar du ett standardschema med namnet dbo under Tabeller. Det här schemat finns alltid där och kan inte ändras eller tas bort. Om du vill skapa ett nytt schema hovra över Tabeller, välj ...och välj Nytt schema. Ange ditt schemanamn och välj Skapa. Schemat visas under Tabeller i alfabetisk ordning.
Lagra tabeller i lakehouse-scheman
Du behöver ett schemanamn för att lagra en tabell i ett schema. Annars går det till standardschemat för dbo .
df.write.mode("Overwrite").saveAsTable("contoso.sales")
Du kan använda Lakehouse Explorer för att ordna dina tabeller och dra och släppa tabellnamn till olika scheman.
Varning
Om du ändrar tabellen måste du också uppdatera relaterade objekt som notebook-kod eller dataflöden för att säkerställa att de är i linje med rätt schema.
Ta med flera tabeller med schemagenväg
Om du vill referera till flera Delta-tabeller från andra Infrastruktursjöhus eller extern lagring använder du schemagenvägen som visar alla tabeller under det valda schemat eller mappen. Eventuella ändringar av tabellerna på källplatsen visas också i schemat. Om du vill skapa en schemagenväg hovra över Tabeller, välj på ...och välj Ny schemagenväg. Välj sedan ett schema på ett annat lakehouse eller en mapp med Delta-tabeller på din externa lagring som Azure Data Lake Storage (ADLS) Gen2. Då skapas ett nytt schema med dina refererade tabeller.
Få åtkomst till Lakehouse-scheman för Power BI-rapportering
Om du vill göra din semantiska modell väljer du bara de tabeller som du vill använda. Tabeller kan finnas i olika scheman. Om tabeller från olika scheman delar samma namn visas tal bredvid tabellnamn när de finns i modellvyn.
Lakehouse-scheman i notebook-fil
När du tittar på ett schemaaktiverat lakehouse i notebook-objektutforskaren ser du att tabeller finns i scheman. Du kan dra och släppa tabellen till en kodcell och hämta ett kodfragment som refererar till schemat där tabellen finns. Använd det här namnområdet om du vill referera till tabeller i koden: "workspace.lakehouse.schema.table". Om du utelämnar något av elementen använder kören standardinställningen. Om du till exempel bara anger tabellnamn används standardschemat (dbo) från standard lakehouse för notebook-filen.
Viktigt!
Om du vill använda scheman i koden kontrollerar du att standardsjöhuset för notebook-filen är schemaaktiverat.
Spark SQL-frågor mellan arbetsytor
Använd namnområdet "workspace.lakehouse.schema.table" för att referera till tabeller i koden. På så sätt kan du koppla tabeller från olika arbetsytor om användaren som kör koden har behörighet att komma åt tabellerna.
SELECT *
FROM operations.hr.hrm.employees as employees
INNER JOIN global.corporate.company.departments as departments
ON employees.deptno = departments.deptno;
Viktigt!
Se till att du endast ansluter tabeller från lakehouses som har scheman aktiverade. Att koppla tabeller från lakehouses som inte har scheman aktiverade fungerar inte.
Begränsningar för offentlig förhandsversion
Nedan visas funktioner som inte stöds för den aktuella versionen av den offentliga förhandsversionen. De kommer att lösas i de kommande versionerna före allmän tillgänglighet.
Funktioner som inte stöds | Kommentar |
---|---|
Delat sjöhus | Att använda arbetsytan i namnområdet för delade sjöhus fungerar inte, t.ex. wokrkspace.sharedlakehouse.schema.table. Användaren måste ha en arbetsyteroll för att kunna använda arbetsytan i namaspace. |
Schema för icke-Delta- och hanterad tabell | Hämtar schema för hanterade, icke-Delta-formaterade tabeller (till exempel CSV) stöds inte. Om du expanderar dessa tabeller i Lakehouse Explorer visas ingen schemainformation i UX. |
Externa Spark-tabeller | Externa Spark-tabellåtgärder (till exempel identifiering, hämtar schema osv.) stöds inte. Dessa tabeller är oidentifierade i UX. |
Offentligt API | Offentliga API:er (listtabeller, inläsningstabeller, exponerande standardSchema utökad egenskap osv.) stöds inte för schemaaktiverade Lakehouse. Befintliga offentliga API:er som anropas för ett schemaaktiverat Lakehouse resulterar i ett fel. |
Tabellunderhåll | Stöds ej. |
Uppdatera tabellegenskaper | Stöds ej. |
Namn på arbetsyta som innehåller specialtecken | Arbetsyta med specialtecken (till exempel blanksteg, snedstreck) stöds inte. Ett användarfel visas. |
Spark-vyer | Stöds ej. |
Hive-specifika funktioner | Stöds ej. |
Spark.catalog API | Stöds ej. Använd Spark SQL i stället. |
USE <schemaName> |
Fungerar inte mellan arbetsytor, men stöds i samma arbetsyta. |
Migrering | Migrering av befintliga lakehouses som inte är schemabaserade till schemabaserade Lakehouses stöds inte. |