Gewijzigde gegevens van Azure Data Lake Storage Gen2 vastleggen in Azure SQL Database met behulp van een gegevensopnameresource voor wijzigingen
VAN TOEPASSING OP: Azure Data Factory Azure Synapse Analytics
Tip
Probeer Data Factory uit in Microsoft Fabric, een alles-in-één analyseoplossing voor ondernemingen. Microsoft Fabric omvat alles, van gegevensverplaatsing tot gegevenswetenschap, realtime analyses, business intelligence en rapportage. Meer informatie over het gratis starten van een nieuwe proefversie .
In dit artikel gebruikt u de Gebruikersinterface van Azure Data Factory om een CDC-resource (Change Data Capture) te maken. De resource haalt gewijzigde gegevens op uit een Azure Data Lake Storage Gen2-bron en voegt deze in realtime toe aan Azure SQL Database.
In dit artikel leert u het volgende:
- Maak een CDC-resource.
- CDC-activiteit bewaken.
U kunt het configuratiepatroon in dit artikel wijzigen en uitbreiden.
Vereisten
Voordat u begint met de procedures in dit artikel, moet u ervoor zorgen dat u over deze resources beschikt:
- Azure-abonnement. Als u geen Azure-abonnement hebt, maakt u een gratis Azure-account.
- SQL-database. U gebruikt Azure SQL Database als brongegevensarchief. Als u geen SQL-database hebt, maakt u er een in Azure Portal.
- Opslagaccount. U gebruikt Delta Lake die is opgeslagen in Azure Data Lake Storage Gen2 als doelgegevensarchief. Als u geen opslagaccount hebt, raadpleegt u Een opslagaccount maken voor de stappen om er een te maken.
Een CDC-artefact maken
Ga naar het deelvenster Auteur in uw data factory. Onder Pijplijnen wordt een nieuw artefact op het hoogste niveau met de naam Change Data Capture (preview) weergegeven.
Beweeg de muisaanwijzer over Change Data Capture (preview) totdat er drie puntjes worden weergegeven. Selecteer vervolgens Acties voor Het vastleggen van gegevens wijzigen (preview).
Selecteer Nieuw CDC (preview). Met deze stap opent u een flyout om het begeleide proces te starten.
U wordt gevraagd uw CDC-resource een naam te geven. De naam is standaard 'adfcdc' met een getal dat met 1 wordt verhoogd. U kunt deze standaardnaam vervangen door een naam die u kiest.
Gebruik de vervolgkeuzelijst om uw gegevensbron te kiezen. Voor dit artikel selecteert u DelimitedText.
U wordt gevraagd om een gekoppelde service te selecteren. Maak een nieuwe gekoppelde service of selecteer een bestaande service.
Gebruik het gebied Broninstellingen om optioneel geavanceerde bronconfiguraties in te stellen, inclusief kolom- en rijscheidingstekens.
Als u deze broninstellingen niet handmatig bewerkt, worden ze ingesteld op de standaardinstellingen.
Gebruik de knop Bladeren om uw brongegevensmap te selecteren.
Nadat u een mappad hebt geselecteerd, selecteert u Doorgaan om het gegevensdoel in te stellen.
U kunt ervoor kiezen om meerdere bronmappen toe te voegen met behulp van de plusknop (+). De andere bronnen moeten ook dezelfde gekoppelde service gebruiken die u al hebt geselecteerd.
Selecteer een doeltypewaarde met behulp van de vervolgkeuzelijst. Voor dit artikel selecteert u Azure SQL Database.
U wordt gevraagd om een gekoppelde service te selecteren. Maak een nieuwe gekoppelde service of selecteer een bestaande service.
Voor doeltabellen kunt u een nieuwe doeltabel maken of een bestaande tabel selecteren:
Als u een doeltabel wilt maken, selecteert u het tabblad Nieuwe entiteiten en selecteert u Nieuwe tabellen bewerken.
Als u een bestaande tabel wilt selecteren, selecteert u het tabblad Bestaande entiteiten en gebruikt u vervolgens het selectievakje om een tabel te kiezen. Gebruik de knop Voorbeeld om de tabelgegevens weer te geven.
Als bestaande tabellen op het doel overeenkomende namen hebben, worden deze standaard geselecteerd onder Bestaande entiteiten. Zo niet, worden nieuwe tabellen met overeenkomende namen gemaakt onder Nieuwe entiteiten. Daarnaast kunt u nieuwe tabellen bewerken met behulp van de knop Nieuwe tabellen bewerken.
U kunt de selectievakjes gebruiken om meerdere doeltabellen uit uw SQL-database te kiezen. Nadat u klaar bent met het kiezen van doeltabellen, selecteert u Doorgaan.
Er wordt een nieuw tabblad voor het vastleggen van wijzigingsgegevens weergegeven. Dit tabblad is de CDC Studio, waar u uw nieuwe resource kunt configureren.
Er wordt automatisch een nieuwe toewijzing voor u gemaakt. U kunt de selecties van de brontabel en doeltabel voor uw toewijzing bijwerken met behulp van de vervolgkeuzelijsten.
Nadat u de tabellen hebt geselecteerd, worden de bijbehorende kolommen standaard toegewezen met de wisselknop Voor automatisch toewijzen ingeschakeld. Automatisch toewijzen wijst de kolommen automatisch toe op naam in de sink, haalt nieuwe kolomwijzigingen op wanneer het bronschema zich ontwikkelt en verzendt deze informatie naar de ondersteunde sinktypen.
Als u Automatische toewijzing wilt gebruiken en geen kolomtoewijzingen wilt wijzigen, gaat u rechtstreeks naar stap 18.
Als u de kolomtoewijzingen wilt inschakelen, selecteert u de toewijzingen en schakelt u de wisselknop voor automatisch toewijzen uit. Selecteer vervolgens de knop Kolomtoewijzingen om de toewijzingen weer te geven.
U kunt op elk gewenst moment weer overschakelen naar automatische toewijzing door de wisselknop voor automatisch toewijzen in te schakelen.
Bekijk uw kolomtoewijzingen. Gebruik de vervolgkeuzelijsten om uw kolomtoewijzingen te bewerken voor toewijzingsmethode, bronkolom en doelkolom.
Op deze pagina kunt u het volgende doen:
- Voeg meer kolomtoewijzingen toe met behulp van de knop Nieuwe toewijzing . Gebruik de vervolgkeuzelijsten om selecties te maken voor toewijzingsmethode, bronkolom en doelkolom.
- Selecteer de kolom Sleutels als u de verwijderbewerking wilt bijhouden voor ondersteunde sinktypen.
- Selecteer de knop Vernieuwen onder Gegevensvoorbeeld om te visualiseren hoe de gegevens naar het doel kijken.
Wanneer de toewijzing is voltooid, selecteert u de pijlknop om terug te keren naar het hoofdcanvas van CDC.
U kunt meer bron-naar-doeltoewijzingen toevoegen in één CDC-artefact. Gebruik de knop Bewerken om meer gegevensbronnen en doelen toe te voegen. Selecteer vervolgens Nieuwe toewijzing en gebruik de vervolgkeuzelijsten om een nieuwe bron en een nieuw doel in te stellen. U kunt automatisch toewijzen afzonderlijk in- of uitschakelen voor elk van deze toewijzingen.
Nadat uw toewijzingen zijn voltooid, stelt u de CDC-latentie in met behulp van de knop Latentie instellen.
Selecteer de latentie van uw CDC en selecteer Vervolgens Toepassen om de wijzigingen aan te brengen.
Latentie is standaard ingesteld op 15 minuten. In het voorbeeld in dit artikel wordt de realtime-optie voor latentie gebruikt. Realtime latentie haalt voortdurend wijzigingen in uw brongegevens op in intervallen van minder dan 1 minuut.
Voor andere latenties (bijvoorbeeld als u 15 minuten selecteert), worden uw brongegevens verwerkt en worden de gewijzigde gegevens sinds de laatste verwerkte tijd opgehaald.
Notitie
Als ondersteuning wordt uitgebreid naar streaminggegevensintegratie (Azure Event Hubs en Kafka-gegevensbronnen), wordt de latentie standaard ingesteld op realtime.
Nadat u klaar bent met het configureren van uw CDC, selecteert u Alles publiceren om uw wijzigingen te publiceren.
Notitie
Als u uw wijzigingen niet publiceert, kunt u uw CDC-resource niet starten. De knop Start in de volgende stap is niet beschikbaar.
Selecteer Start om uw wijzigingsgegevensopname uit te voeren.
Uw wijzigingsgegevens vastleggen bewaken
Open het deelvenster Monitor met behulp van een van deze methoden:
Selecteer Change Data Capture (preview) om uw CDC-resources weer te geven.
In het deelvenster Gegevens vastleggen van wijzigingen ziet u de bron-, doel-, status- en laatst verwerkte gegevens voor het vastleggen van wijzigingengegevens.
Selecteer de naam van uw CDC voor meer informatie. U kunt zien hoeveel wijzigingen (invoegen, bijwerken of verwijderen) zijn gelezen en geschreven, samen met andere diagnostische gegevens.
Als u meerdere toewijzingen instelt in uw wijzigingsgegevensopname, wordt elke toewijzing weergegeven als een andere kleur. Selecteer de balk om specifieke details voor elke toewijzing weer te geven of gebruik de diagnostische gegevens onderaan het deelvenster.