Hvad er lakehouse-skemaer (prøveversion)?
Lakehouse understøtter oprettelse af brugerdefinerede skemaer. Skemaer giver dig mulighed for at gruppere tabellerne sammen for at få bedre datasøgning, adgangskontrol og meget mere.
Opret et lakehouse-skema
Hvis du vil aktivere skemaunderstøttelser for dit lakehouse, skal du markere afkrydsningsfeltet ud for Lakehouse-skemaer (Offentlig prøveversion), når du opretter det.
Vigtigt
Navne på arbejdsområder må kun indeholde alfanumeriske tegn på grund af begrænsninger for eksempelvisning. Hvis der bruges specialtegn i arbejdsområdenavne, fungerer nogle af Lakehouse-funktionerne ikke.
Når du har oprettet lakehouse'et, kan du finde et standardskema med navnet dbo under Tabeller. Dette skema er altid der og kan ikke ændres eller fjernes. Hvis du vil oprette et nyt skema, skal du holde markøren over Tabeller, vælge ...og vælge Nyt skema. Angiv dit skemanavn, og vælg Opret. Du kan se skemaet under Tabeller i alfabetisk rækkefølge.
Gem tabeller i lakehouse-skemaer
Du skal bruge et skemanavn for at gemme en tabel i et skema. Ellers går det til dbo-standardskemaet.
df.write.mode("Overwrite").saveAsTable("contoso.sales")
Du kan bruge Lakehouse Explorer til at arrangere tabeller og trække og slippe tabelnavne til forskellige skemaer.
Advarsel
Hvis du ændrer tabellen, skal du også opdatere relaterede elementer, f.eks. notesbogkode eller dataflow, for at sikre, at de er justeret i overensstemmelse med det korrekte skema.
Hent flere tabeller med skemagenvej
Hvis du vil referere til flere Delta-tabeller fra et andet Fabric lakehouse eller et eksternt lager, skal du bruge en skemagenvej, der viser alle tabeller under det valgte skema eller den valgte mappe. Eventuelle ændringer af tabellerne på kildeplaceringen vises også i skemaet. Hvis du vil oprette en skemagenvej, skal du holde markøren over Tabeller, vælge ...og vælge Ny skemagenvej. Vælg derefter et skema i et andet lakehouse eller en mappe med Delta-tabeller på dit eksterne lager, f.eks. Azure Data Lake Storage (ADLS) Gen2. Det opretter et nyt skema med de tabeller, der refereres til.
Få adgang til lakehouse-skemaer til Power BI-rapportering
Hvis du vil gøre din semantiske model, skal du blot vælge de tabeller, du vil bruge. Tabeller kan være i forskellige skemaer. Hvis tabeller fra forskellige skemaer deler det samme navn, kan du se tal ud for tabelnavne, når de er i modelvisningen.
Lakehouse-skemaer i notesbog
Når du ser på et skemaaktiveret lakehouse i stifinderen til notesbogobjektet, kan du se, at tabeller er i skemaer. Du kan trække og slippe tabellen i en kodecelle og få et kodestykke, der refererer til det skema, hvor tabellen er placeret. Brug dette navneområde til at referere til tabeller i din kode: "workspace.lakehouse.schema.table". Hvis du udelader nogen af elementerne, bruger eksekveren standardindstillingen. Hvis du f.eks. kun giver tabelnavnet, bruges standardskemaet (dbo) fra standard lakehouse for notesbogen.
Vigtigt
Hvis du vil bruge skemaer i din kode, skal du sørge for, at standardsøhuset for notesbogen er skemaaktiveret.
Spark SQL-forespørgsler på tværs af arbejdsområder
Brug navneområdet "workspace.lakehouse.schema.table" til at referere til tabeller i koden. På denne måde kan du joinforbinde tabeller fra forskellige arbejdsområder, hvis den bruger, der kører koden, har tilladelse til at få adgang til tabellerne.
SELECT *
FROM operations.hr.hrm.employees as employees
INNER JOIN global.corporate.company.departments as departments
ON employees.deptno = departments.deptno;
Vigtigt
Sørg for kun at joinforbinde tabeller fra lakehouses, hvor skemaer er aktiveret. Det fungerer ikke at forbinde tabeller fra lakehouses, der ikke har skemaer aktiveret.
Begrænsninger for offentlig prøveversion
Nedenfor vises funktioner/funktioner, der ikke understøttes, til den aktuelle version af den offentlige prøveversion. De løses i de kommende udgivelser, før de er offentligt tilgængelige.
Funktioner/funktioner, der ikke understøttes | Bemærkninger |
---|---|
Fælles lakehouse | Brug af arbejdsområdet i navneområdet til delte lakehouses fungerer ikke, f.eks. wokrkspace.sharedlakehouse.schema.table. Brugeren skal have en arbejdsområderolle for at kunne bruge arbejdsområdet i namaspace. |
Ikke-Delta, administreret tabelskema | Hentning af skema for administrerede, ikke-Delta-formaterede tabeller (f.eks. CSV) understøttes ikke. Hvis du udvider disse tabeller i Lakehouse Explorer, vises der ingen skemaoplysninger i UX'en. |
Eksterne Spark-tabeller | Eksterne Spark-tabelhandlinger (f.eks. registrering, hentning af skema osv.) understøttes ikke. Disse tabeller er uidentificerede i UX'en. |
Offentlig API | Offentlige API'er (listetabeller, indlæsningstabel, eksponering af egenskaben DefaultSchema extended osv.) understøttes ikke for skemaaktiveret Lakehouse. Eksisterende offentlige API'er, der kaldes for et skemaaktiveret Lakehouse, resulterer i en fejl. |
Opdater tabelegenskaber | Ikke understøttet. |
Navn på arbejdsområde, der indeholder specialtegn | Arbejdsområde med specialtegn (f.eks. mellemrum, skråstreger) understøttes ikke. Der vises en brugerfejl. |
Spark-visninger | Ikke understøttet. |
Hive-specifikke funktioner | Ikke understøttet. |
Spark.catalog-API | Ikke understøttet. Brug Spark SQL i stedet. |
USE <schemaName> |
Fungerer ikke på tværs af arbejdsområder, men understøttes i samme arbejdsområde. |
Migrering | Overførsel af eksisterende Lakehouses, der ikke er skemabaserede, til skemabaserede Lakehouses understøttes ikke. |