Gerealiseerde weergaven gebruiken in Databricks SQL
Notitie
Als u een Azure Private Link-verbinding met uw gerealiseerde weergave wilt gebruiken, neemt u contact op met uw Databricks-vertegenwoordiger.
In dit artikel wordt beschreven hoe u gerealiseerde weergaven maakt en gebruikt in Databricks SQL om de prestaties te verbeteren en de kosten van uw gegevensverwerkings- en analyseworkloads te verlagen.
Belangrijk
Gerealiseerde weergaven die zijn gemaakt in Databricks SQL, worden ondersteund door een serverloze Delta Live Tables-pijplijn. Uw werkruimte moet serverloze pijplijnen ondersteunen om deze functionaliteit te kunnen gebruiken.
Wat zijn gerealiseerde weergaven?
In Databricks SQL zijn gerealiseerde weergaven beheerde tabellen van Unity Catalog waarmee gebruikers resultaten vooraf kunnen compileren op basis van de nieuwste versie van gegevens in brontabellen. Gerealiseerde weergaven in Azure Databricks verschillen van andere implementaties, omdat de geretourneerde resultaten de status van de gegevens weerspiegelen wanneer de gerealiseerde weergave voor het laatst werd vernieuwd in plaats van altijd resultaten bij te werken wanneer de gerealiseerde weergave wordt opgevraagd. U kunt gerealiseerde weergaven handmatig vernieuwen of vernieuwingen plannen.
Gerealiseerde weergaven zijn krachtig voor gegevensverwerkingsworkloads, zoals ETL-verwerking (extract, transform en load). Gerealiseerde weergaven bieden een eenvoudige, declaratieve manier om gegevens te verwerken voor naleving, correcties, aggregaties of algemene wijzigingsgegevensopname (CDC). Gerealiseerde weergaven verlagen de kosten en verbeteren de querylatentie door trage query's en veelgebruikte berekeningen vooraf te berekenen. Gerealiseerde weergaven maken ook gebruiksvriendelijke transformaties mogelijk door basistabellen op te schonen, verrijken en denormaliseren. Gerealiseerde weergaven kunnen kosten verlagen terwijl ze een vereenvoudigde eindgebruikerservaring bieden, omdat ze in sommige gevallen incrementeel wijzigingen kunnen berekenen uit de basistabellen.
Gerealiseerde weergaven werden voor het eerst ondersteund in Azure Databricks met de lancering van Delta Live Tables. Wanneer u een gerealiseerde weergave maakt in een Databricks SQL Warehouse, wordt er een serverloze pijplijn gemaakt om vernieuwingen naar de gerealiseerde weergave te verwerken. U kunt de status van vernieuwingsbewerkingen bewaken in de gebruikersinterface van Delta Live Tables of de pijplijn-API. Zie De status van een gerealiseerde weergave vernieuwen weergeven.
Eisen
Gerealiseerde weergaven maken of vernieuwen:
U moet een pro- of serverloze SQL-warehouse met Unity Catalog gebruiken.
Als u een gerealiseerde weergave wilt vernieuwen, moet u zich in de werkruimte bevinden die deze heeft gemaakt.
Uw werkruimte moet zich in een regio bevinden die ondersteuning biedt voor serverloze SQL-warehouses.
Gerealiseerde weergaven opvragen:
- U moet de eigenaar van de gerealiseerde weergave zijn of beschikken
SELECT
over de gerealiseerde weergave, samen metUSE SCHEMA
enUSE CATALOG
op de ouders. - U moet een van de volgende rekenresources gebruiken:
- SQL Warehouse
- Delta Live Tables-interfaces
- Berekening van gedeelde toegangsmodus
- De toegangsmodus voor één gebruiker in Databricks Runtime 15.4 en hoger, zolang de werkruimte is ingeschakeld voor serverloze berekeningen. Zie Gedetailleerd toegangsbeheer voor rekenkracht van één gebruiker.
- Alleen als u de gerealiseerde weergave-eigenaar bent: één rekenresource voor gebruikerstoegangsmodus waarop Databricks Runtime tussen 14.3 en 15.3 wordt uitgevoerd.
Een gerealiseerde weergave maken
Databricks SQL gerealiseerde weergavebewerkingen CREATE
maken gebruik van een Databricks SQL Warehouse om gegevens te maken en te laden in de gerealiseerde weergave. Het maken van een gerealiseerde weergave is een synchrone bewerking, wat betekent dat de CREATE MATERIALIZED VIEW
opdracht wordt geblokkeerd totdat de gerealiseerde weergave wordt gemaakt en de initiële gegevensbelasting is voltooid. Er wordt automatisch een serverloze Delta Live Tables-pijplijn gemaakt voor elke gerealiseerde Databricks SQL-weergave. Wanneer de gerealiseerde weergave wordt vernieuwd , verwerkt de pijplijn delta livetabellen de vernieuwing.
Gebruik de CREATE MATERIALIZED VIEW
instructie om een gerealiseerde weergave te maken. Als u een create-instructie wilt verzenden, gebruikt u de SQL-editor in de Azure Databricks-gebruikersinterface, de Databricks SQL CLI of de Databricks SQL-API.
Notitie
De gebruiker die een gerealiseerde weergave maakt, is de gerealiseerde eigenaar van de weergave en moet over de volgende machtigingen beschikken:
SELECT
bevoegdheid voor de basistabellen waarnaar wordt verwezen door de gerealiseerde weergave.USE CATALOG
enUSE SCHEMA
bevoegdheden voor de catalogus en het schema met de brontabellen voor de gerealiseerde weergave.USE CATALOG
enUSE SCHEMA
bevoegdheden voor de doelcatalogus en het schema voor de gerealiseerde weergave.CREATE TABLE
enCREATE MATERIALIZED VIEW
bevoegdheden voor het schema met de gerealiseerde weergave.
In het volgende voorbeeld wordt de gerealiseerde weergave mv1
gemaakt op basis van de basistabel base_table1
:
CREATE MATERIALIZED VIEW mv1
AS SELECT
date, sum(sales) AS sum_of_sales
FROM
base_table1
GROUP BY
date;
Het runtimekanaal instellen
Gerealiseerde weergaven die zijn gemaakt met behulp van SQL-warehouses, worden automatisch vernieuwd met behulp van een Delta Live Tables-pijplijn. Delta Live Tables-pijplijnen maken standaard gebruik van de runtime in het current
kanaal. Zie releaseopmerkingen voor Delta Live Tables en het release-upgradeproces voor meer informatie over het releaseproces.
Databricks raadt het gebruik van het current
kanaal aan voor productieworkloads. Nieuwe functies worden voor het eerst uitgebracht voor het preview
kanaal. U kunt een pijplijn instellen op het kanaal Delta Live Tables om nieuwe functies te testen door deze op te geven preview
als een tabeleigenschap. U kunt deze eigenschap opgeven wanneer u de tabel maakt of nadat de tabel is gemaakt met behulp van een ALTER-instructie.
In het volgende codevoorbeeld ziet u hoe u het kanaal instelt op preview in een CREATE-instructie:
CREATE OR REPLACE MATERIALIZED VIEW foo.default.bar
TBLPROPERTIES ('pipelines.channel' = 'preview') as
SELECT
*
FROM
range(5)
Gegevens laden uit externe systemen
Databricks raadt aan externe gegevens te laden met Lakehouse Federation voor ondersteunde gegevensbronnen. Zie Opties voor gegevensindeling voor informatie over het laden van gegevens uit bronnen die niet worden ondersteund door Lakehouse Federation.
Een gerealiseerde weergave vernieuwen
De REFRESH
bewerking vernieuwt de gerealiseerde weergave om de meest recente wijzigingen in de basistabel weer te geven. De bewerking is standaard synchroon, wat betekent dat de opdracht wordt geblokkeerd totdat de vernieuwingsbewerking is voltooid. Gebruik de REFRESH MATERIALIZED VIEW
instructie om een gerealiseerde weergave te vernieuwen. Zie REFRESH (MATERIALIZED VIEW of STREAMING TABLE) voor meer informatie over de SQL-syntaxis en parameters voor deze opdracht. Zie Incrementeel vernieuwen voor gerealiseerde weergaven voor gerealiseerde weergaven voor meer informatie over de typen gerealiseerde weergaven die incrementeel kunnen worden vernieuwd.
Als u een vernieuwingsinstructie wilt verzenden, gebruikt u de SQL-editor in de Gebruikersinterface van Azure Databricks, een notebook dat is gekoppeld aan een SQL-warehouse, de Databricks SQL CLI of de Databricks SQL-API.
Alleen de eigenaar kan REFRESH
de gerealiseerde weergave.
In het volgende voorbeeld wordt de mv1
gerealiseerde weergave vernieuwd:
REFRESH MATERIALIZED VIEW mv1;
Hoe worden gerealiseerde databricks SQL-weergaven vernieuwd?
Gerealiseerde weergaven maken en gebruiken automatisch serverloze Delta Live Tables-pijplijnen om vernieuwingsbewerkingen te verwerken. De vernieuwing wordt beheerd door de Delta Live Tables-pijplijn en de update wordt bewaakt door het Databricks SQL-warehouse dat wordt gebruikt om de gerealiseerde weergave te maken. Gerealiseerde weergaven kunnen worden bijgewerkt met behulp van een Delta Live Tables-pijplijn die volgens een schema wordt uitgevoerd. Zie Geactiveerd versus continue pijplijnmodus.
Notitie
De Delta Live Tables-runtime kan geen wijzigingen in niet-Delta-gegevensbronnen detecteren. De tabel wordt nog steeds regelmatig bijgewerkt, maar met een hoger standaardtriggerinterval om te voorkomen dat overmatige hercomputatie de incrementele verwerking op de berekening vertraagt.
Vernieuwingsbewerkingen worden standaard synchroon uitgevoerd. U kunt ook een vernieuwingsbewerking instellen om asynchroon te worden uitgevoerd. Dit kan worden ingesteld met behulp van de opdracht Vernieuwen. Zie REFRESH (MATERIALIZED VIEW of STREAMING TABLE) Het gedrag dat aan elke benadering is gekoppeld, is als volgt:
- Synchroon: Een synchrone vernieuwing voorkomt dat andere bewerkingen worden uitgevoerd totdat het vernieuwen is voltooid. Als het resultaat nodig is voor de volgende stap, zoals bij het sequentiëren van vernieuwingsbewerkingen in indelingshulpprogramma's zoals Databricks-taken, gebruikt u een synchrone vernieuwing. Als u gerealiseerde weergaven wilt organiseren met een taak, gebruikt u het TYPE SQL-taak . Zie Werkstromen plannen en organiseren.
- Asynchroon: een asynchrone vernieuwing start een achtergrondtaak op Delta Live Tables wanneer een gerealiseerde vernieuwing van de weergave begint, zodat de opdracht kan worden geretourneerd voordat de gegevens worden geladen. Dit vernieuwingstype kan kosten besparen omdat de bewerking niet noodzakelijkerwijs rekencapaciteit bevat in het magazijn waar de opdracht wordt gestart. Als de vernieuwing niet actief wordt en er geen andere taken worden uitgevoerd, kan het magazijn worden afgesloten terwijl de vernieuwing gebruikmaakt van andere beschikbare berekeningen. Daarnaast bieden asynchrone vernieuwingen ondersteuning voor het parallel starten van meerdere bewerkingen.
Sommige query's kunnen incrementeel worden vernieuwd. Zie Incrementeel vernieuwen voor gerealiseerde weergaven. Als een incrementele vernieuwing niet kan worden uitgevoerd, wordt in plaats daarvan een volledige vernieuwing uitgevoerd.
Gerealiseerde weergavevernieuwing plannen
U kunt een gerealiseerde databricks SQL-weergave configureren om automatisch te vernieuwen op basis van een gedefinieerd schema. Ga op een van de volgende manieren te werk om een planning in te stellen:
- De planning configureren met de
SCHEDULE
component wanneer u de gerealiseerde weergave maakt - Voeg een schema toe met de instructie ALTER MATERIALIZED VIEW .
Wanneer een planning wordt gemaakt, wordt automatisch een nieuwe Databricks-taak geconfigureerd om de update te verwerken.
Ga op een van de volgende manieren te werk om de planning weer te geven:
- Voer de
DESCRIBE EXTENDED
instructie uit vanuit de SQL-editor in de Gebruikersinterface van Azure Databricks. - Gebruik Catalog Explorer om de gerealiseerde weergave weer te geven. De planning wordt weergegeven op het tabblad Overzicht , onder Status Vernieuwen. Zie Wat is Catalog Explorer?
De status van een gerealiseerde weergave vernieuwen weergeven
Notitie
Omdat een Delta Live Tables-pijplijn gerealiseerde weergavevernieuwingen beheert, wordt er latentie gemaakt door de opstarttijd voor de pijplijn. Deze tijd kan in de seconden tot minuten zijn, naast de tijd die nodig is om de vernieuwing uit te voeren.
U kunt de status van een gerealiseerde weergavevernieuwing bekijken door de pijplijn te bekijken die de gerealiseerde weergave beheert in de gebruikersinterface van Delta Live Tables of door de vernieuwingsgegevens te bekijken die door de DESCRIBE EXTENDED
opdracht voor de gerealiseerde weergave worden geretourneerd.
U kunt ook de vernieuwingsgeschiedenis van een gerealiseerde weergave bekijken door een query uit te voeren op het gebeurtenislogboek van Delta Live Tables. Zie De vernieuwingsgeschiedenis voor een gerealiseerde weergave weergeven.
Uitvoeringen bewaken met querygeschiedenis
U kunt de pagina querygeschiedenis gebruiken om toegang te krijgen tot querydetails en queryprofielen waarmee u slecht presterende query's en knelpunten in de Delta Live Tables-pijplijn kunt identificeren die worden gebruikt om updates voor de streamingtabel uit te voeren. Zie Querygeschiedenis en Queryprofiel voor een overzicht van het soort informatie dat beschikbaar is voor querygeschiedenissen en queryprofielen.
Belangrijk
Deze functie is beschikbaar als openbare preview. Werkruimtebeheerders kunnen deze functie inschakelen vanaf de pagina Previews . Zie Previews van Azure Databricks beheren.
Alle instructies met betrekking tot gerealiseerde weergaven worden weergegeven in de querygeschiedenis. U kunt het vervolgkeuzefilter Instructie gebruiken om een opdracht te selecteren en de gerelateerde query's te inspecteren. Alle CREATE
instructies worden gevolgd door een REFRESH
instructie die asynchroon wordt uitgevoerd op een Delta Live Tables-pijplijn. De REFRESH
instructies bevatten doorgaans gedetailleerde queryplannen die inzicht bieden in het optimaliseren van de prestaties.
Gebruik de volgende stappen om toegang te krijgen tot REFRESH
instructies in de gebruikersinterface voor querygeschiedenis:
- Klik in de linkerzijbalk om de gebruikersinterface voor querygeschiedenis te openen.
- Schakel het selectievakje VERNIEUWEN in de vervolgkeuzelijst Instructie in.
- Klik op de naam van de query-instructie om overzichtsdetails weer te geven, zoals de duur van de query en geaggregeerde metrische gegevens.
- Klik op Queryprofiel weergeven om het queryprofiel te openen. Zie Queryprofiel voor meer informatie over het navigeren in het queryprofiel.
- U kunt eventueel de koppelingen in de sectie Querybron gebruiken om de gerelateerde query of pijplijn te openen.
Notitie
Uw gerealiseerde weergave moet worden geconfigureerd om te worden uitgevoerd met behulp van het preview-kanaal . Zie Het runtime-kanaal instellen.
Zie DE GEREALISEERDE WEERGAVE CREATE.
De vernieuwingsstatus weergeven in de gebruikersinterface van Delta Live Tables
De Delta Live Tables-pijplijn waarmee een gerealiseerde weergave wordt beheerd, is standaard niet zichtbaar in de gebruikersinterface van Delta Live Tables. Als u de pijplijn wilt weergeven in de gebruikersinterface van Delta Live Tables, moet u rechtstreeks toegang krijgen tot de koppeling naar de pagina Met pijplijndetails van de pijplijn. Ga als volgende te werk om toegang te krijgen tot de koppeling:
- Kopieer en plak de koppeling die wordt weergegeven in de rij Meest recente vernieuwing van de tabel die door de
DESCRIBE EXTENDED
instructie wordt geretourneerd. - Klik op het tabblad Herkomst voor de gerealiseerde weergave op Pijplijnen en klik vervolgens op de pijplijnkoppeling.
Voor asynchrone REFRESH
opdrachten die zijn verzonden met behulp van de SQL-editor in de gebruikersinterface van Azure Databricks, kunt u de vernieuwingsstatus bekijken door de koppeling te volgen die wordt weergegeven in het deelvenster Resultaten .
Een actieve vernieuwing stoppen
Als u een actieve vernieuwing in de gebruikersinterface van Delta Live Tables wilt stoppen, klikt u op de pagina Pijplijndetails op Stoppen om de pijplijnupdate te stoppen. U kunt het vernieuwen ook stoppen met de Databricks CLI of de POST/api/2.0/pipelines/{pipeline_id}/stopbewerking in de Pijplijn-API.
De definitie van een gerealiseerde weergave bijwerken
Als u de definitie van een gerealiseerde weergave wilt bijwerken, moet u eerst de gerealiseerde weergave verwijderen en vervolgens de gerealiseerde weergave opnieuw maken.
Een gerealiseerde weergave verwijderen
Notitie
Als u de opdracht wilt verzenden om een gerealiseerde weergave te verwijderen, moet u de eigenaar van die gerealiseerde weergave zijn.
Als u een gerealiseerde weergave wilt verwijderen, gebruikt u de instructie DROP VIEW . Als u een DROP
instructie wilt verzenden, kunt u de SQL-editor gebruiken in de Gebruikersinterface van Azure Databricks, de Databricks SQL CLI of de Databricks SQL-API. In het volgende voorbeeld wordt de mv1
gerealiseerde weergave weggezakt:
DROP MATERIALIZED VIEW mv1;
Een gerealiseerde weergave beschrijven
Gebruik de DESCRIBE
instructie om de kolommen en gegevenstypen voor een gerealiseerde weergave op te halen. Als u de kolommen, gegevenstypen en metagegevens zoals eigenaar, locatie, aanmaaktijd en vernieuwingsstatus voor een gerealiseerde weergave wilt ophalen, gebruikt u DESCRIBE EXTENDED
. Als u een DESCRIBE
instructie wilt verzenden, gebruikt u de SQL-editor in de Gebruikersinterface van Azure Databricks, de Databricks SQL CLI of de Databricks SQL-API.
De eigenaar van een gerealiseerde weergave wijzigen
U kunt de eigenaar van een gerealiseerde weergave wijzigen als u zowel een metastore-beheerder als een werkruimtebeheerder bent. Gerealiseerde weergaven maken en gebruiken pijplijnen van Delta Live Tables automatisch om wijzigingen te verwerken. Gebruik de volgende stappen om de eigenaar van een gerealiseerde weergave te wijzigen:
- Klik op het tabblad Herkomst voor de gerealiseerde weergave op Pijplijnen en klik vervolgens op de pijplijnkoppeling.
- Klik ophetmenu rechts van de naam van de pijplijn en klik op Machtigingen. Hiermee opent u het dialoogvenster Machtigingen.
- Klik op x rechts van de naam van de huidige eigenaar om de huidige eigenaar te verwijderen.
- Begin te typen om de lijst met beschikbare gebruikers te filteren. Klik op de gebruiker die de nieuwe eigenaar van de pijplijn moet zijn.
- Klik op Opslaan om de wijzigingen op te slaan en het dialoogvenster te sluiten.
Alle pijplijnassets, inclusief gerealiseerde weergaven die zijn gedefinieerd in de pijplijn, zijn eigendom van de nieuwe eigenaar van de pijplijn. Alle toekomstige updates worden uitgevoerd met behulp van de identiteit van de nieuwe eigenaar.
Toegang tot gerealiseerde weergaven beheren
Gerealiseerde weergaven bieden ondersteuning voor uitgebreide besturingselementen voor toegang tot het delen van gegevens en voorkomen dat mogelijk persoonlijke gegevens worden weergegeven. De eigenaar van een gerealiseerde weergave kan bevoegdheden verlenen SELECT
aan andere gebruikers. Gebruikers met SELECT
toegang tot de gerealiseerde weergave hebben geen toegang nodig SELECT
tot de tabellen waarnaar wordt verwezen door de gerealiseerde weergave. Met dit toegangsbeheer kunt u gegevens delen terwijl u de toegang tot de onderliggende gegevens beheert.
Bevoegdheden verlenen aan een gerealiseerde weergave
Gebruik de GRANT
instructie om toegang te verlenen tot een gerealiseerde weergave:
GRANT
privilege_type [, privilege_type ] ...
ON <mv_name> TO principal;
De privilege_type kan het volgende zijn:
SELECT
- de gebruiker kanSELECT
de gerealiseerde weergave.REFRESH
- de gebruiker kanREFRESH
de gerealiseerde weergave. Vernieuwingen worden uitgevoerd met behulp van de machtigingen van de eigenaar.
In het volgende voorbeeld wordt een gerealiseerde weergave gemaakt en worden selectie- en vernieuwingsbevoegdheden verleend aan een gebruiker:
CREATE MATERIALIZED VIEW <mv_name> AS SELECT * FROM <base_table>;
GRANT SELECT ON <mv_name> TO user;
GRANT REFRESH ON <mv_name> TO user;
Bevoegdheden intrekken vanuit een gerealiseerde weergave
Als u de toegang vanuit een gerealiseerde weergave wilt intrekken, gebruikt u de REVOKE
instructie:
REVOKE
privilege_type [, privilege_type ]
ON <name> FROM principal;
Wanneer SELECT
bevoegdheden voor een basistabel worden ingetrokken van de gerealiseerde weergave-eigenaar of een andere gebruiker die bevoegdheden heeft gekregen voor de gerealiseerde weergave, of als de basistabel wordt verwijderd, kan de gerealiseerde weergave-eigenaar of gebruiker die toegang heeft verleend SELECT
, nog steeds een query uitvoeren op de gerealiseerde weergave. Het volgende gedrag treedt echter op:
- De gerealiseerde weergave-eigenaar of anderen die de toegang tot een gerealiseerde weergave hebben verloren, kunnen die gerealiseerde weergave niet meer
REFRESH
gebruiken en de gerealiseerde weergave wordt verouderd. - Als geautomatiseerd met een schema, mislukt de volgende geplande
REFRESH
bewerking of wordt deze niet uitgevoerd.
In het volgende voorbeeld wordt de SELECT
bevoegdheid ingetrokken van mv1
:
REVOKE SELECT ON mv1 FROM user1;
Wijzigingenfeed inschakelen
Wijzigingenfeed is vereist voor de gerealiseerde weergaven basistabellen, met uitzondering van bepaalde geavanceerde gebruiksvoorbeelden. Als u de gegevensfeed voor een basistabel wilt inschakelen, stelt u de delta.enableChangeDataFeed
tabeleigenschap in met behulp van de volgende syntaxis:
ALTER TABLE table1 SET TBLPROPERTIES (delta.enableChangeDataFeed = true);
De vernieuwingsgeschiedenis voor een gerealiseerde weergave weergeven
Als u de status van REFRESH
bewerkingen in een gerealiseerde weergave wilt weergeven, inclusief huidige en eerdere vernieuwingen, voert u een query uit op het gebeurtenislogboek van Delta Live Tables:
SELECT
*
FROM
event_log(TABLE(<fully-qualified-table-name>))
WHERE
event_type = "update_progress"
ORDER BY
timestamp desc;
Vervang door <fully-qualified-table-name>
de volledig gekwalificeerde naam van de gerealiseerde weergave, inclusief de catalogus en het schema.
Zie Wat is het gebeurtenislogboek van Delta Live Tables?
Beperkingen
- Zie Vereisten voor reken- en werkruimtevereisten.
- Gerealiseerde weergaven bieden geen ondersteuning voor identiteitskolommen of surrogaatsleutels.
- Als een gerealiseerde weergave gebruikmaakt van een somaggregaties voor een
NULL
kolom die in staat is en alleenNULL
waarden in die kolom blijven, is de gerealiseerde weergaven resulterende statistische waarde nul in plaats vanNULL
. - U kunt een wijzigingsgegevensfeed niet lezen vanuit een gerealiseerde weergave.
- Query's voor tijdreizen worden niet geïmaliseerd op gerealiseerde weergaven.
- De onderliggende bestanden die gerealiseerde weergaven ondersteunen, bevatten mogelijk gegevens uit upstreamtabellen (inclusief mogelijke persoonsgegevens) die niet worden weergegeven in de gerealiseerde weergavedefinitie. Deze gegevens worden automatisch toegevoegd aan de onderliggende opslag ter ondersteuning van incrementeel vernieuwen van gerealiseerde weergaven. Omdat de onderliggende bestanden van een gerealiseerde weergave mogelijk risico lopen dat gegevens uit upstream-tabellen worden weergegeven die geen deel uitmaken van het gerealiseerde weergaveschema, raadt Databricks aan om de onderliggende opslag niet te delen met niet-vertrouwde downstreamgebruikers. Stel dat de definitie van een gerealiseerde weergave een
COUNT(DISTINCT field_a)
component bevat. Hoewel de gerealiseerde weergavedefinitie alleen de statistischeCOUNT DISTINCT
component bevat, bevatten de onderliggende bestanden een lijst met de werkelijke waarden vanfield_a
.