Hantera integreringskörningar
I Data Factory definierar en aktivitet åtgärden som ska utföras. En länkad tjänst definierar ett datalager som mål eller en beräkningstjänst. En integreringskörning tillhandahåller infrastrukturen för aktiviteten och länkade tjänster.
Integration Runtime refereras av den länkade tjänsten eller aktiviteten och tillhandahåller beräkningsmiljön där aktiviteten antingen körs på eller skickas från. På så sätt kan aktiviteten utföras i regionen som är den närmaste möjliga till måldatalagret eller beräkningstjänsten på det bästa sättet samtidigt som den uppfyller säkerhets- och efterlevnadsbehoven.
Kort och kort är Integration Runtime (IR) den beräkningsinfrastruktur som används av Azure Data Factory. Den innehåller följande funktioner för dataintegrering i olika nätverksmiljöer, inklusive:
- Dataflöde: Kör en Dataflöde i en hanterad Azure-beräkningsmiljö.
- Dataflytt: Kopiera data mellan datalager i offentliga nätverk och datalager i privata nätverk (lokalt eller virtuellt privat nätverk). Den ger stöd åt inbyggda anslutningsappar, konvertering av format, kolumnmappning och bättre och skalbar dataöverföring.
- Aktivitetsutskick: Skicka och övervaka omvandlingsaktiviteter som körs på en mängd olika beräkningstjänster, till exempel Azure Databricks, Azure HDInsight, Azure Machine Learning, Azure SQL Database, SQL Server med mera.
- SSIS paketkörning: Internt köra SQL Server Integration Services-paket (SSIS) i en hanterad Azure-beräkningsmiljö.
När en Azure Data Factory-instans skapas skapas en standardmiljö för integrationskörning som stöder åtgärder i molndatalager och beräkningstjänster i det offentliga nätverket. Detta kan visas när integrationskörningen är inställd på Lös automatiskt
Integration Runtime
Data Factory erbjuder tre typer av Integration Runtime och du bör välja den typ som fungerar bäst med dataintegreringstjänsterna och de nätverksmiljöbehov du har. Dessa tre typer är:
- Azure
- Lokalt installerad
- Azure-SSIS
Du kan uttryckligen definiera inställningen Integration Runtime i egenskapen connectVia . Om detta inte har definierats används standardinställningen Integration Runtime med egenskapen inställd på Lös automatiskt.
I följande tabell beskrivs funktioner och nätverksstöd för varje Integration Runtime-typ:
IR-typ | Offentligt nätverk | Privat nätverk |
---|---|---|
Azure | Dataflöde | Dataflöde |
Dataflytt | Dataflytt | |
Aktivitetssändning | Aktivitetssändning | |
Lokalt installerad | Dataflytt | Dataflytt |
Aktivitetssändning | Aktivitetssändning | |
Azure-SSIS | Körning av SSIS-paket | Körning av SSIS-paket |
Avgöra vilken integrationskörning som ska användas
Det finns ett antal faktorer som påverkar den integrationskörning som du ska använda. Följande är en guide som hjälper dig att välja rätt IR
Kopieringsaktivitet
För aktiviteten Kopiera krävs käll- och mottagarlänkade tjänster för att definiera dataflödets riktning. Följande logik används till att bestämma vilken Integration Runtime-instans som används för att utföra kopieringen:
Kopiera mellan två molndatakällor: när både käll- och mottagarnoderna för länkade tjänster använder Azure IR, använder ADF en regional Azure IR om du har angett eller automatiskt bestämt en plats för Azure IR om du väljer lös IR automatiskt (standard), enligt beskrivningen i avsnittet Plats för integreringskörning.
Kopiera mellan molndatalager och datakälla i privat nätverk: om den länkade källtjänsten eller den länkade mottagartjänsten pekar på en IR med egen värd körs kopieringsaktiviteten på den Integration Runtime med egen värd.
Kopiering mellan två datakällor i det privata nätverket: både den länkade käll- och mottagartjänsten måste peka på samma instans av integrationskörningen och att integrationskörningen används för att köra kopieringsaktiviteten.
Lookup och GetMetadata-aktivitet
Aktiviteterna Lookup och GetMetadata har körts på integreringskörningsmiljön som är associerad med den länkade datalagringstjänsten.
Transformeringsaktivitet
Varje transformeringsaktivitet har en länkad målberäkningstjänst, som pekar på en Integration Runtime. Denna Integration Runtime-instans är där transformeringsaktiviteten skickas från.
Dataflöde aktivitet
Dataflöde aktivitet körs på den integrationskörning som är associerad med den.