Dela via


Vad är datateknik i Microsoft Fabric?

Datateknik i Microsoft Fabric gör det möjligt för användare att utforma, bygga och underhålla infrastrukturer och system som gör det möjligt för deras organisationer att samla in, lagra, bearbeta och analysera stora mängder data.

Microsoft Fabric tillhandahåller olika funktioner för datateknik för att säkerställa att dina data är lättillgängliga, välorganiserade och av hög kvalitet. Från datateknikens startsida kan du:

  • Skapa och hantera dina data med hjälp av ett sjöhus

  • Utforma pipelines för att kopiera data till ditt lakehouse

  • Använda Spark-jobbdefinitioner för att skicka batch-/direktuppspelningsjobb till Spark-kluster

  • Använda notebook-filer för att skriva kod för datainmatning, förberedelse och transformering

    Skärmbild som visar Datateknik objekt.

Sjöhus

Lakehouses är dataarkitekturer som gör det möjligt för organisationer att lagra och hantera strukturerade och ostrukturerade data på en enda plats, med hjälp av olika verktyg och ramverk för att bearbeta och analysera dessa data. Dessa verktyg och ramverk kan omfatta SQL-baserade frågor och analyser, samt maskininlärning och andra avancerade analystekniker.

Definition av Apache Spark-jobb

Spark-jobbdefinitioner är en uppsättning instruktioner som definierar hur du kör ett jobb i ett Spark-kluster. Den innehåller information som indata- och utdatakällor, transformeringar och konfigurationsinställningar för Spark-programmet. Med Spark-jobbdefinitionen kan du skicka batch-/strömningsjobb till Spark-kluster, tillämpa olika transformeringslogik på data som finns i ditt lakehouse tillsammans med många andra saker.

Notebook-fil

Notebook-filer är en interaktiv databehandlingsmiljö som gör det möjligt för användare att skapa och dela dokument som innehåller livekod, ekvationer, visualiseringar och narrativ text. De gör det möjligt för användare att skriva och köra kod på olika programmeringsspråk, inklusive Python, R och Scala. Du kan använda notebook-filer för datainmatning, förberedelse, analys och andra datarelaterade uppgifter.

Datapipeline

Datapipelines är en serie steg som kan samla in, bearbeta och transformera data från dess rådata till ett format som du kan använda för analys och beslutsfattande. De är en viktig komponent i datatekniken eftersom de är ett sätt att flytta data från källan till målet på ett tillförlitligt, skalbart och effektivt sätt.

Du kan använda Datateknik i Microsoft Fabric kostnadsfritt när du registrerar dig för fabric-utvärderingsversionen. Du kan också köpa en Microsoft Fabric-kapacitet eller en reserverad infrastrukturkapacitet

Kom igång med Datateknik: