Vad är datateknik i Microsoft Fabric?

Artikel
01/26/2025

Datateknik i Microsoft Fabric gör det möjligt för användare att utforma, bygga och underhålla infrastrukturer och system som gör det möjligt för deras organisationer att samla in, lagra, bearbeta och analysera stora mängder data.

Microsoft Fabric tillhandahåller olika funktioner för datateknik för att säkerställa att dina data är lättillgängliga, välorganiserade och av hög kvalitet. Från datateknikens startsida kan du:

Skapa och hantera dina data med hjälp av ett sjöhus
Utforma pipelines för att kopiera data till ditt lakehouse
Använda Spark-jobbdefinitioner för att skicka batch-/direktuppspelningsjobb till Spark-kluster
Använda notebook-filer för att skriva kod för datainmatning, förberedelse och transformering

Sjöhus

Lakehouses är dataarkitekturer som gör det möjligt för organisationer att lagra och hantera strukturerade och ostrukturerade data på en enda plats, med hjälp av olika verktyg och ramverk för att bearbeta och analysera dessa data. Dessa verktyg och ramverk kan omfatta SQL-baserade frågor och analyser, samt maskininlärning och andra avancerade analystekniker.

Definition av Apache Spark-jobb

Spark-jobbdefinitioner är en uppsättning instruktioner som definierar hur du kör ett jobb i ett Spark-kluster. Den innehåller information som indata- och utdatakällor, transformeringar och konfigurationsinställningar för Spark-programmet. Med Spark-jobbdefinitionen kan du skicka batch-/strömningsjobb till Spark-kluster, tillämpa olika transformeringslogik på data som finns i ditt lakehouse tillsammans med många andra saker.

Anteckningsbok

Notebook-filer är en interaktiv databehandlingsmiljö som gör det möjligt för användare att skapa och dela dokument som innehåller livekod, ekvationer, visualiseringar och narrativ text. De gör det möjligt för användare att skriva och köra kod på olika programmeringsspråk, inklusive Python, R och Scala. Du kan använda notebook-filer för datainmatning, förberedelse, analys och andra datarelaterade uppgifter.

Datapipeline

Datapipelines är en serie steg som kan samla in, bearbeta och transformera data från dess rådata till ett format som du kan använda för analys och beslutsfattande. De är en viktig komponent i datatekniken eftersom de är ett sätt att flytta data från källan till målet på ett tillförlitligt, skalbart och effektivt sätt.

Du kan använda Data Engineering i Microsoft Fabric kostnadsfritt när du registrerar dig för Fabric-utvärderingsversionen. Du kan också köpa en Microsoft Fabric-kapacitet eller en reserverad Microsoft Fabric-kapacitet

Kom igång med datateknik:

Mer information om lakehouses finns i Vad är ett sjöhus i Microsoft Fabric?
Om du vill komma igång med ett sjöhus kan du läsa Skapa ett sjöhus i Microsoft Fabric.
Mer information om Apache Spark-jobbdefinitioner finns i Vad är en Apache Spark-jobbdefinition?
Information om hur du kommer igång med en Apache Spark-jobbdefinition finns i Så här skapar du en Apache Spark-jobbdefinition i Fabric.
Mer information om notebook-filer finns i Author and execute the notebook.
Information om hur du kommer igång med pipelinekopieringsaktivitet finns i Så här kopierar du data med hjälp av kopieringsaktiviteten.

Dela via

Vad är datateknik i Microsoft Fabric?

Sjöhus

Definition av Apache Spark-jobb

Anteckningsbok

Datapipeline

Feedback

Ytterligare resurser

Dela via

Vad är datateknik i Microsoft Fabric?

Sjöhus

Definition av Apache Spark-jobb

Anteckningsbok

Datapipeline

Relaterat innehåll

Feedback

Ytterligare resurser