Dela via


Vad är dataflöden?

Dricks

Prova Dataflow Gen2 i Data Factory i Microsoft Fabric, en allt-i-ett-analyslösning för företag. Microsoft Fabric omfattar allt från dataflytt till datavetenskap, realtidsanalys, business intelligence och rapportering. Lär dig hur du startar en ny utvärderingsversion kostnadsfritt!

Dataflöden är en molnbaserad dataförberedelseteknik med självbetjäning. Med dataflöden kan kunder mata in, transformera och läsa in data i Microsoft Dataverse-miljöer, Power BI-arbetsytor eller organisationens Azure Data Lake Storage-konto. Dataflöden skapas med hjälp av Power Query, en enhetlig dataanslutning och förberedelseupplevelse som redan finns i många Microsoft-produkter, inklusive Excel och Power BI. Kunder kan utlösa dataflöden för att köras antingen på begäran eller automatiskt enligt ett schema. data alltid hålls uppdaterade.

Dataflöden kan skapas i flera Microsoft-produkter

Dataflöden finns i flera Microsoft-produkter och kräver inte att en dataflödesspecifik licens skapas eller körs. Dataflöden är tillgängliga i Power Apps, Power BI och Dynamics 365 Customer Insights. Möjligheten att skapa och köra dataflöden paketeras med dessa produkters licenser. Dataflödesfunktioner är oftast vanliga för alla produkter som de finns i, men vissa produktspecifika funktioner kan finnas i dataflöden som skapats i en produkt jämfört med en annan.

Hur fungerar dataflödet?

Image of how dataflows function, from the source data, to the transformation process, and then to storage.

Föregående bild visar en övergripande vy över hur ett dataflöde definieras. Ett dataflöde hämtar data från olika datakällor (fler än 80 datakällor stöds redan). Sedan, baserat på de transformeringar som konfigurerats med Power Query-redigeringsupplevelsen, transformerar dataflödet data med hjälp av dataflödesmotorn. Slutligen läses data in till utdatamålet, som kan vara en Microsoft Power Platform-miljö, en Power BI-arbetsyta eller organisationens Azure Data Lake Storage-konto.

Dataflöden körs i molnet

Dataflöden är molnbaserade. När ett dataflöde skapas och sparas lagras dess definition i molnet. Ett dataflöde körs också i molnet. Men om en datakälla är lokal kan en lokal datagateway användas för att extrahera data till molnet. När en dataflödeskörning utlöses sker datatransformeringen och beräkningen i molnet och målet finns alltid i molnet.

Image of how dataflows run in the cloud, from the data source, to the dataflow running in the cloud, and then to storage.

Dataflöden använder en kraftfull transformeringsmotor

Power Query är den datatransformeringsmotor som används i dataflödet. Den här motorn är tillräckligt kapabel för att stödja många avancerade omvandlingar. Den använder också ett enkelt, men kraftfullt, grafiskt användargränssnitt som kallas Power Query-redigeraren. Du kan använda dataflöden med den här redigeraren för att utveckla dina dataintegreringslösningar snabbare och enklare.

Screenshot showing an example of Power Query transformations.

Dataflödesintegrering med Microsoft Power Platform och Dynamics 365

Eftersom ett dataflöde lagrar de resulterande tabellerna i molnbaserad lagring kan andra tjänster interagera med data som produceras av dataflöden.

Image of how a dataflow integrates with Microsoft Power Platform and Dynamics 365.

Till exempel kan Power BI-, Power Apps-, Power Automate-, Power Virtual Agents- och Dynamics 365-program hämta data som produceras av dataflödet genom att ansluta till Dataverse, en Anslutningsapp för Power Platform-dataflöde eller direkt via sjön, beroende på målet som konfigurerats vid skapande av dataflöde.

Fördelar med dataflöden

I följande lista visas några av fördelarna med att använda dataflöden:

  • Ett dataflöde frikopplar datatransformeringslagret från modellerings- och visualiseringslagret i en Power BI-lösning.

  • Datatransformeringskoden kan finnas på en central plats, ett dataflöde, i stället för att spridas ut mellan flera artefakter.

  • En dataflödesskapare behöver bara Power Query-kunskaper. I en miljö med flera skapare kan dataflödesskapare ingå i ett team som tillsammans skapar hela BI-lösningen eller driftprogrammet.

  • Ett dataflöde är produktagnostiskt. Det är inte bara en komponent i Power BI. du kan hämta dess data i andra verktyg och tjänster.

  • Dataflöden drar nytta av Power Query, en kraftfull, grafisk datatransformeringsupplevelse med självbetjäning.

  • Dataflöden körs helt i molnet. Ingen ytterligare infrastruktur krävs.

  • Du har flera alternativ för att börja arbeta med dataflöden med hjälp av licenser för Power Apps, Power BI och Customer Insights.

  • Även om dataflöden kan utföra avancerade transformeringar är de utformade för självbetjäningsscenarier och kräver ingen IT- eller utvecklarbakgrund.

Användningsfallsscenarier för dataflöden

Du kan använda dataflöden i många syften. Följande scenarier innehåller några exempel på vanliga användningsfall för dataflöden.

Datamigrering från äldre system

I det här scenariot har en organisation beslutat att använda Power Apps för den nya användargränssnittsupplevelsen i stället för det äldre lokala systemet. Power Apps, Power Automate och AI Builder använder alla Dataverse som det primära datalagringssystemet. Aktuella data i det befintliga lokala systemet kan migreras till Dataverse med hjälp av ett dataflöde, och sedan kan dessa produkter använda dessa data.

Använda dataflöden för att skapa ett informationslager

Du kan använda dataflöden som ersättning för andra verktyg för extrahering, transformering, inläsning (ETL) för att skapa ett informationslager. I det här scenariot bestämmer sig datatekniker för ett företag för att använda dataflöden för att skapa sitt stjärnschemadesignade informationslager, inklusive fakta- och dimensionstabeller i Data Lake Storage. Sedan används Power BI för att generera rapporter och instrumentpaneler genom att hämta data från dataflödena.

Image of how to build a data warehouse using dataflows.

Använda dataflöden för att skapa en dimensionsmodell

Du kan använda dataflöden som ersättning för andra ETL-verktyg för att skapa en dimensionsmodell. Till exempel bestämmer sig datatekniker för ett företag för att använda dataflöden för att skapa den stjärnschemadesignade dimensionsmodellen, inklusive fakta- och dimensionstabeller i Azure Data Lake Storage Gen2. Sedan används Power BI för att generera rapporter och instrumentpaneler genom att hämta data från dataflödena.

Image of how to build a dimensional model using dataflows.

Centralisera dataförberedelse och återanvändning av semantiska modeller i flera Power BI-lösningar

Om flera Power BI-lösningar använder samma transformerade version av en tabell upprepas processen för att skapa tabellen flera gånger. Detta ökar belastningen på källsystemet, förbrukar fler resurser och skapar duplicerade data med flera felpunkter. I stället kan du skapa ett enda dataflöde för att beräkna data för alla lösningar. Power BI kan sedan återanvända resultatet av omvandlingen i alla lösningar. Dataflödet, om det används på ett sådant sätt, kan vara en del av en robust Power BI-implementeringsarkitektur som undviker Power Query-koden dubbletter och minskar underhållskostnaderna för dataintegreringslagret.

Image of how tables can be reused across multiple solutions.

Nästa steg

Följande artiklar innehåller ytterligare studiematerial för dataflöden.