Snel starten: Een nieuwe lake-database maken met behulp van databasesjablonen
Deze quickstart biedt een volledig voorbeeldscenario over hoe u databasesjablonen kunt toepassen om een Lake-database te maken, gegevens uit te lijnen op uw nieuwe model en de geïntegreerde ervaring te gebruiken om de gegevens te analyseren.
Vereisten
- Ten minste synapse-gebruikersrolmachtigingen zijn vereist voor het verkennen van een Lake-databasesjabloon vanuit de galerie.
- Synapse Administrator- of Synapse-inzendermachtigingen zijn vereist voor de Azure Synapse-werkruimte voor het maken van een Lake-database.
- Inzendermachtigingen voor Opslagblobgegevens zijn vereist voor Data Lake wanneer u de optie Tabel maken vanuit data lake gebruikt.
Een lake-database maken op basis van databasesjablonen
Gebruik de nieuwe functionaliteit voor databasesjablonen om een Lake-database te maken die u kunt gebruiken om uw gegevensmodel voor de database te configureren.
Voor ons scenario gebruiken we de Retail
databasesjabloon en selecteren we de volgende entiteiten:
- RetailProduct - Een product is alles wat kan worden aangeboden aan een markt die mogelijk voldoet aan een behoefte van potentiële klanten. Dat product is de som van alle fysieke, psychologische, symbolische en servicekenmerken die eraan zijn gekoppeld.
- Transactie : het laagste niveau van uitvoerbare werk- of klantactiviteit. Een transactie bestaat uit een of meer discrete gebeurtenissen.
- TransactionLineItem - De onderdelen van een transactie onderverdeeld op product en hoeveelheid, één per regelitem.
- Party - Een partij is een persoon, organisatie, rechtspersoon, sociale organisatie of bedrijfseenheid van belang voor het bedrijf.
- Klant : een klant is een persoon of rechtspersoon die een product of service heeft gekocht of heeft gekocht.
- Kanaal - Een kanaal is een middel waarmee producten of services worden verkocht en/of gedistribueerd.
De eenvoudigste manier om entiteiten te vinden is door het zoekvak boven de verschillende bedrijfsgebieden te gebruiken die de tabellen bevatten.
Lake-database configureren
Nadat u de database hebt gemaakt, moet u ervoor zorgen dat het opslagaccount en het bestandspad zijn ingesteld op een locatie waar u de gegevens wilt opslaan. Het pad wordt standaard ingesteld op het primaire opslagaccount in Azure Synapse Analytics, maar kan worden gewijzigd in uw behoeften.
Als u uw indeling wilt opslaan en beschikbaar wilt maken in Azure Synapse, publiceert u alle wijzigingen. Met deze stap wordt de installatie van de Lake-database voltooid en beschikbaar gemaakt voor alle onderdelen binnen Azure Synapse Analytics en buiten de database.
Gegevens opnemen in lake-database
Als u gegevens wilt opnemen in de Lake-database, kunt u pijplijnen uitvoeren met toewijzingen van codevrije gegevensstromen, die een Workspace DB-connector hebben om gegevens rechtstreeks naar de databasetabel te laden. U kunt ook de interactieve Spark-notebooks gebruiken om gegevens op te nemen in de Lake-databasetabellen:
%%sql
INSERT INTO `retail_mil`.`customer` VALUES (1,date('2021-02-18'),1022,557,101,'Tailspin Toys (Head Office)','Waldemar Fisar',90410,466);
Query’s uitvoeren voor de gegevens
Nadat de Lake-database is gemaakt, zijn er verschillende manieren om een query uit te voeren op de gegevens. Momenteel worden SQL-databases in serverloze SQL-pools ondersteund en krijgen ze automatisch inzicht in de zojuist gemaakte Lake-databaseindeling.
SELECT TOP (100) [ProductId]
,[ProductName]
,[ProductDescription]
,[ProductInternalName]
,[ItemSku]
,[PrimaryBrandId]
FROM [Retail_mil].[dbo].[RetailProduct]
De andere manier om toegang te krijgen tot de gegevens in Azure Synapse is door een nieuw Spark-notebook te openen en de geïntegreerde ervaring daar te gebruiken:
df = spark.sql("SELECT * FROM `Retail_mil`.`RetailProduct`")
df.show(10)
Volgende stappen
Ga verder met het verkennen van de mogelijkheden van de databaseontwerper met behulp van de onderstaande koppelingen.