Vad är datateknik i Microsoft Fabric?
Datateknik i Microsoft Fabric gör det möjligt för användare att utforma, bygga och underhålla infrastrukturer och system som gör det möjligt för deras organisationer att samla in, lagra, bearbeta och analysera stora mängder data.
Microsoft Fabric tillhandahåller olika funktioner för datateknik för att säkerställa att dina data är lättillgängliga, välorganiserade och av hög kvalitet. Från datateknikens startsida kan du:
Skapa och hantera dina data med hjälp av ett sjöhus
Utforma pipelines för att kopiera data till ditt lakehouse
Använda Spark-jobbdefinitioner för att skicka batch-/direktuppspelningsjobb till Spark-kluster
Använda notebook-filer för att skriva kod för datainmatning, förberedelse och transformering
Sjöhus
Lakehouses är dataarkitekturer som gör det möjligt för organisationer att lagra och hantera strukturerade och ostrukturerade data på en enda plats, med hjälp av olika verktyg och ramverk för att bearbeta och analysera dessa data. Dessa verktyg och ramverk kan omfatta SQL-baserade frågor och analyser, samt maskininlärning och andra avancerade analystekniker.
Definition av Apache Spark-jobb
Spark-jobbdefinitioner är en uppsättning instruktioner som definierar hur du kör ett jobb i ett Spark-kluster. Den innehåller information som indata- och utdatakällor, transformeringar och konfigurationsinställningar för Spark-programmet. Med Spark-jobbdefinitionen kan du skicka batch-/strömningsjobb till Spark-kluster, tillämpa olika transformeringslogik på data som finns i ditt lakehouse tillsammans med många andra saker.
Notebook-fil
Notebook-filer är en interaktiv databehandlingsmiljö som gör det möjligt för användare att skapa och dela dokument som innehåller livekod, ekvationer, visualiseringar och narrativ text. De gör det möjligt för användare att skriva och köra kod på olika programmeringsspråk, inklusive Python, R och Scala. Du kan använda notebook-filer för datainmatning, förberedelse, analys och andra datarelaterade uppgifter.
Datapipeline
Datapipelines är en serie steg som kan samla in, bearbeta och transformera data från dess rådata till ett format som du kan använda för analys och beslutsfattande. De är en viktig komponent i datatekniken eftersom de är ett sätt att flytta data från källan till målet på ett tillförlitligt, skalbart och effektivt sätt.
Du kan använda Datateknik i Microsoft Fabric kostnadsfritt när du registrerar dig för fabric-utvärderingsversionen. Du kan också köpa en Microsoft Fabric-kapacitet eller en reserverad infrastrukturkapacitet
Relaterat innehåll
Kom igång med Datateknik:
- Mer information om lakehouses finns i Vad är ett sjöhus i Microsoft Fabric?
- Information om hur du kommer igång med ett sjöhus finns i Skapa ett sjöhus i Microsoft Fabric.
- Mer information om Apache Spark-jobbdefinitioner finns i Vad är en Apache Spark-jobbdefinition?
- Information om hur du kommer igång med en Apache Spark-jobbdefinition finns i Så här skapar du en Apache Spark-jobbdefinition i Infrastrukturresurser.
- Mer information om notebook-filer finns i Redigera och kör notebook-filen.
- Information om hur du kommer igång med pipelinekopieringsaktivitet finns i Kopiera data med hjälp av kopieringsaktivitet.