Dela via


Använda Azure Data Factory för att migrera data från din datasjö eller ditt informationslager till Azure

GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics

Dricks

Prova Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!

Om du vill migrera din datasjö eller ditt företags informationslager (EDW) till Microsoft Azure kan du överväga att använda Azure Data Factory. Azure Data Factory passar bra för följande scenarier:

  • Migrering av stordataarbetsbelastning från Amazon Simple Storage Service (Amazon S3) eller ett lokalt Hadoop Distributed File System (HDFS) till Azure
  • EDW-migrering från Oracle Exadata, Netezza, Teradata eller Amazon Redshift till Azure

Azure Data Factory kan flytta petabyte (PB) med data för datasjömigrering och tiotals terabyte (TB) data för migrering av informationslager.

Varför Azure Data Factory kan användas för datamigrering

  • Azure Data Factory kan enkelt skala upp mängden bearbetningskraft för att flytta data på ett serverlöst sätt med hög prestanda, motståndskraft och skalbarhet. Och du betalar bara för det du använder. Observera även följande:
    • Azure Data Factory har inga begränsningar för datavolymen eller antalet filer.
    • Azure Data Factory kan fullt ut använda nätverks- och lagringsbandbredden för att uppnå den högsta mängden dataförflyttningsdataflöde i din miljö.
    • Azure Data Factory använder en betala per användning-metod, så att du bara betalar för den tid du faktiskt använder för att köra datamigreringen till Azure.
  • Azure Data Factory kan utföra både en historisk engångsbelastning och schemalagda inkrementella inläsningar.
  • Azure Data Factory använder Azure Integration Runtime (IR) för att flytta data mellan offentligt tillgängliga datasjöar och lagerslutpunkter. Den kan också använda lokalt installerad IR för att flytta data för datasjö- och lagerslutpunkter i Azure Virtual Network (VNet) eller bakom en brandvägg.
  • Azure Data Factory har säkerhet i företagsklass: Du kan använda Windows Installer (MSI) eller Tjänstidentitet för säker tjänst-till-tjänst-integrering eller använda Azure Key Vault för hantering av autentiseringsuppgifter.
  • Azure Data Factory ger en kodfri redigeringsupplevelse och en omfattande, inbyggd instrumentpanel för övervakning. 

Datamigrering online jämfört med offline

Azure Data Factory är ett standardverktyg för datamigrering online för att överföra data över ett nätverk (Internet, ER eller VPN). Med datamigrering offline skickar användare fysiskt dataöverföringsenheter från sin organisation till ett Azure Data Center.

Det finns tre viktiga överväganden när du väljer mellan en online- och offlinemigreringsmetod:

  • Storleken på data som ska migreras
  • Nätverksbandbredd
  • Migreringsfönster

Anta till exempel att du planerar att använda Azure Data Factory för att slutföra datamigreringen inom två veckor (ditt migreringsfönster). Lägg märke till den rosa/blå klippta linjen i följande tabell. Den lägsta rosa cellen för en viss kolumn visar den datastorlek/nätverksbandbreddsparing vars migreringsfönster är närmast men mindre än två veckor. (Alla storleks-/bandbreddsparningar i en blå cell har ett onlinemigreringsfönster på mer än två veckor.)

online jämfört med offline Den här tabellen hjälper dig att avgöra om du kan uppfylla ditt avsedda migreringsfönster via onlinemigrering (Azure Data Factory) baserat på storleken på dina data och din tillgängliga nätverksbandbredd. Om onlinemigreringsfönstret är mer än två veckor vill du använda offlinemigrering.

Kommentar

Genom att använda onlinemigrering kan du uppnå både historisk datainläsning och inkrementella feeds från slutpunkt till slutpunkt via ett enda verktyg. Med den här metoden kan dina data synkroniseras mellan det befintliga arkivet och det nya arkivet under hela migreringsfönstret. Det innebär att du kan återskapa ETL-logiken i det nya arkivet med uppdaterade data.