Vad är dataomvandling?
GÄLLER FÖR: Azure Data Factory Azure Synapse Analytics
Dricks
Prova Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!
Dataomvandling innebär att transformera och formatera om data från den ursprungliga källan för att göra dem mer lämpliga och användbara för olika underordnade program.
Organisationer måste ha möjlighet att utforska sina kritiska affärsdata för förberedelse och vädring av data för att kunna tillhandahålla korrekt analys av komplexa data som fortsätter att växa varje dag. Dataförberedelse krävs så att organisationer kan använda data i olika affärsprocesser och minska tiden till värde.
Data Factory ger dig möjlighet att förbereda kodfria data i molnskala iterativt med hjälp av Power Query. Data Factory integreras med Power Query Online och gör Power Query M-funktioner tillgängliga som en pipelineaktivitet.
Data Factory översätter M som genererats av Power Query Online Mashup Editor till Spark-kod för körning i molnskala genom att översätta M till Azure Data Factory-Dataflöde. Att omvandla data med Power Query och dataflöden är särskilt användbart för datatekniker eller "medborgardataintegratörer".
Användningsfall
Snabb interaktiv datautforskning och förberedelse
Flera datatekniker och integrerare av medborgardata kan interaktivt utforska och förbereda datauppsättningar i molnskala. Med ökad volym, variation och hastighet för data i datasjöar behöver användarna ett effektivt sätt att utforska och förbereda datauppsättningar. Du kan till exempel behöva skapa en datauppsättning som "har all kunddemografiinformation för nya kunder sedan 2017". Du mappas inte till ett känt mål. Du utforskar, vrider och förbereder datauppsättningar för att uppfylla ett krav innan du publicerar dem i sjön. Wrangling används ofta för mindre formella analysscenarier. De färdiga datauppsättningarna kan användas för att utföra transformeringar och maskininlärningsåtgärder nedströms.
Kodfri agil dataförberedelse
Integrerare av medborgardata ägnar mer än 60 % av sin tid åt att söka efter och förbereda data. De vill göra det på ett kodfritt sätt för att förbättra driftproduktiviteten. Att tillåta integrering av medborgardata att berika, forma och publicera data med hjälp av kända verktyg som Power Query Online på ett skalbart sätt förbättrar deras produktivitet drastiskt. Med wrangling i Azure Data Factory kan den välbekanta Power Query Online-kombinationsredigeraren göra det möjligt för medborgarens dataintegrerare att snabbt åtgärda fel, standardisera data och producera data av hög kvalitet för att stödja affärsbeslut.
Dataverifiering och utforskning
Genomsök dina data visuellt på ett kodfritt sätt för att ta bort avvikande värden, avvikelser och anpassa dem till en form för snabb analys.
Källor som stöds
Anslutningsapp | Dataformat | Authentication type |
---|---|---|
Azure Blob Storage | CSV, Parquet, Excel | Kontonyckel, tjänstens huvudnamn, MSI |
Azure Data Lake Storage Gen1 | CSV, Parquet, Excel | Tjänstens huvudnamn, MSI |
Azure Data Lake Storage Gen2 | CSV, Parquet, Excel | Kontonyckel, tjänstens huvudnamn, MSI |
Azure SQL Database | - | SQL-autentisering, MSI, tjänstens huvudnamn |
Azure Synapse Analytics | - | SQL-autentisering, MSI, tjänstens huvudnamn |
Kombinationsredigeraren
När du skapar en Power Query-aktivitet blir alla källdatauppsättningar datauppsättningsfrågor och placeras i mappen ADFResource . Som standard pekar UserQuery på den första datauppsättningsfrågan. Alla transformeringar bör utföras på UserQuery eftersom ändringar i datauppsättningsfrågor inte stöds och inte heller kommer de att sparas. Det går för närvarande inte att byta namn på, lägga till och ta bort frågor.
För närvarande stöds inte alla Power Query M-funktioner för dataomvandling trots att de är tillgängliga under redigeringen. När du skapar dina Power Query-aktiviteter uppmanas du med följande felmeddelande om en funktion inte stöds:
The Power Query Spark Runtime does not support the function
Mer information om transformeringar som stöds finns i Power Query-dataomvandlingsfunktioner.
Relaterat innehåll
Lär dig hur du skapar ett power query-kombinationsprogram för dataomvandling.