Wat zijn tabellen en weergaven?
Tabellen en weergaven zijn fundamentele concepten in Databricks voor het ordenen en openen van gegevens.
Een tabel is een gestructureerde gegevensset die is opgeslagen op een specifieke locatie, meestal in Delta Lake-indeling. Tabellen slaan werkelijke gegevens op in opslag en kunnen worden opgevraagd en gemanipuleerd met behulp van SQL-opdrachten of DataFrame-API's, ondersteunende bewerkingen zoals invoegen, bijwerken, verwijderen en samenvoegen. Zie Wat is een tabel?
Een weergave is een virtuele tabel die is gedefinieerd door een SQL-query. In een weergave worden geen gegevens opgeslagen. In plaats daarvan biedt een weergave een manier om gegevens uit een of meer tabellen in een specifieke indeling of abstractie weer te geven. Weergaven zijn handig voor het vereenvoudigen van complexe query's, het inkapselen van bedrijfslogica en het bieden van een consistente interface voor de onderliggende gegevens zonder opslag te dupliceren. Zie Wat is een weergave?
Tabellen en weergaven in Unity Catalog
Tabellen en weergaven worden beheerd met behulp van Unity Catalog. In Unity Catalog bevinden tabellen en weergaven zich op het derde niveau van de naamruimte op drie niveaus (catalog.schema.table), zoals wordt weergegeven in het volgende diagram.
Verschillen tussen Delta-tabellen, streamingtabellen en gerealiseerde weergaven
In de volgende tabel vindt u antwoorden op veelgestelde vragen over de verschillen tussen Delta-tabellen, streamingtabellen en gerealiseerde weergaven.
Vraag | Delta-tabel | ST | MV |
---|---|---|---|
Wat is het? | Standaardtabellen die zijn opgeslagen in de Delta Lake-indeling, ondersteuning voor ACID-transacties, schema afdwinging en andere Delta Lake-functies. | Een reguliere Delta-tabel die is uitgebreid voor gebruiksscenario's voor streaming en incrementele verwerking. | Het resultaat van een query waarvan het resultaat altijd vooraf wordt berekend en juist is. |
Voor welke use cases wordt het aanbevolen? | Procedurele code die het volgende doet: -Inname -Transformatie |
Declaratieve code die het volgende doet: - Opname uit bronnen met alleen toevoeggegevens - Transformaties met lage latentie |
Declaratieve code die het volgende doet: - Incrementele transformaties - Batchtransformaties |
Hoe wordt het ingevuld? | Procedurele code (INSERT , UPDATE , MERGE partitie overschrijven met behulp van replaceWhere ) |
Declaratieve code, waaronder: - Stromen toevoegen - WIJZIGINGENSTROMEN TOEPASSEN - Eenmaal stromen |
Declaratieve query's |
Wat is het objecttype in Unity Catalog? | Tabel | Tabel | Weergave |
Wie kan het bijwerken? | Elke schrijver die een Delta-tabel kan bijwerken. | Alleen de pijplijn die de streamingtabel definieert, kan deze bijwerken. | Alleen de pijplijn die de gerealiseerde weergave definieert, kan deze bijwerken. |
Met welke Delta Lake-functies is het compatibel? | Ondersteunt alle Delta Lake-functies. | Biedt geen ondersteuning voor: - Liquid Partitioning - Voorspellende optimalisatie |
Biedt geen ondersteuning voor: - Liquid Partitioning - Voorspellende optimalisatie |