När du ska använda Azure Data Factory

Slutförd

I den här lektionen diskuterar vi hur du avgör om Azure Data Factory är en lämplig dataintegreringslösning för din organisation. Vi utvärderar Azure Data Factory mot följande kriterier:

  • Krav för dataintegrering
  • Kodningsresurser
  • Stöd för flera datakällor
  • Serverlös infrastruktur

Beslutsvillkor

Om du vill ta reda på om du vill använda Azure Data Factory använder du de kriterier som beskrivs i följande tabell.

Villkor Analys
Behöver du alls dataintegrering? Om din organisation arbetar med stordata eller är en traditionell relationsdatalagerorganisation kan du vara intresserad av en dataintegreringslösning.
Har du de kodningsresurser som behövs? Alla som arbetar med data har inte erfarenhet av kodning. Vissa kanske föredrar att arbeta med grafiska verktyg som tillhandahåller visualiseringar för att skapa uppgifter som fungerar med källdata.
Behöver du arbeta med flera datakällor? Vissa organisationer kan ha sina rådata lagrade i en rad olika system, både lokala och molnbaserade. En dataanalyslösning måste enkelt kunna ansluta till många datakällor.
Kan du skapa, hantera och underhålla separata komponenter för dataintegrering? Utan en hanterad tjänst för dataanalys måste företag skapa anpassade komponenter för dataflytt. Alternativt kan de skapa anpassade tjänster för att integrera sina datakällor och bearbetning. Det kan vara dyrt och svårt att integrera och underhålla sådana system. Dessutom har inte alla sådana system den övervakning, avisering och de kontroller som en fullständigt hanterad tjänst erbjuder.

Tillämpa kriterierna

Läs följande frågor när du överväger Azure Data Factory som din dataintegreringslösning.

Behöver du alls dataintegrering?

Om din organisation är liten och fungerar med begränsade datakällor kanske du inte behöver någon dataintegreringstjänst alls. Men om din organisation arbetar med stordata, eller är en traditionell relationsdatalagerorganisation, kan du dra nytta av en lösning för dataintegrering. Tänk också på följande faktorer:

  • Stordataorganisationer förlitar sig på tekniker för hantering av stora mängder olika data. För dem tillhandahåller Azure Data Factory ett sätt att skapa och köra pipelines i molnet. Dessa pipelines kan komma åt både molnbaserade och lokala datatjänster. Dessa pipelines fungerar vanligtvis med tekniker som Azure Synapse Analytics, Azure Blobs och Azure Data Lake. Dessutom Azure HDInsight, Azure Databricks och Azure Machine Learning.
  • Organisationer för relationsdatalager förlitar sig vanligtvis på tekniker som SQL Server. SQL Server Integration Services (SSIS) används ofta för att skapa SSIS-paket. För sådana organisationer ger Azure Data Factory dem möjlighet att köra SSIS-paket i Azure, så att de får åtkomst till både molnbaserade och lokala datatjänster.

Har du de kodningsresurser som behövs?

Om din organisation saknar de nödvändiga kodningsresurserna för att skapa de aktiviteter som krävs bör du överväga Azure Data Factory. Azure Data Factory tillhandahåller en låg kod-/ingen kodprocess för att arbeta med datakällor och relaterade aktiviteter. Med redigerings- och övervakningsverktyget för Azure Data Factory kan du till exempel skapa pipelines grafiskt genom att dra och släppa aktiviteter till en designyta. Följande skärmbild visar gränssnittet där en datatekniker skapar en pipeline med flera aktiviteter:

Skärmbild som visar redigerings- och övervakningsverktyget för Azure Data Factory.

Behöver du arbeta med flera datakällor?

Om din organisation har ett krav på att få åtkomst till data på flera platser och från flera källor måste du överväga en dataintegreringslösning som ger den här supporten. Azure Data Factory använder anslutningsappar för att integrera med olika datakällor. Det finns för närvarande fler än 90 datakällor som stöds. Dessutom har Azure Data Factory stöd för utökningsbara alternativ för att nå andra datakällor.

Kan du skapa, hantera och underhålla separata komponenter för dataintegrering?

Det kan vara komplext och tidskrävande att skapa och hantera en egen serverbaserad dataintegreringslösning. Men om det fungerar för dig att köra en sådan lösning i organisationens datacenter behöver du inte överväga Azure Data Factory. Det finns dock fördelar med att använda en fullständigt hanterad, serverlös lösning för dataintegrering. Viktiga fördelar är:

  • Möjligheten att skala efter behov för att stödja fler arbetsbelastningar.
  • Du behöver inte distribuera, konfigurera och underhålla servrar som värd för dina arbetsbelastningar för dataintegrering.

Sammanfattning

Sammanfattningsvis bör du överväga Azure Data Factory när du uppfyller ett eller flera av följande kriterier:

  • Dina datatekniker saknar den tid som krävs för att skapa kod för att utföra dataanalysuppgifter.
  • Du har flera datakällor på olika platser.
  • Du vill dra nytta av en fullständigt hanterad, molnbaserad lösning.