Del via


Microsoft Fabric terminologi

Lær definisjonene av begreper som brukes i Microsoft Fabric, inkludert begreper som er spesifikke for Fabric Data Warehouse, Fabric Dataingeniør ing, Fabric Data Science, Real-Time Intelligence, Data Factory og Power BI.

Generelle termer

  • Kapasitet: Kapasitet er et dedikert sett med ressurser som er tilgjengelig på et gitt tidspunkt som skal brukes. Kapasitet definerer en ressurss mulighet til å utføre en aktivitet eller produsere utdata. Ulike elementer bruker forskjellig kapasitet på et bestemt tidspunkt. Fabric tilbyr kapasitet gjennom Fabric SKU og Trials. Hvis du vil ha mer informasjon, kan du se Hva er kapasitet?

  • Opplevelse: En samling av funksjoner som er rettet mot en bestemt funksjonalitet. Stoffopplevelsene inkluderer Fabric Data Warehouse, Fabric Dataingeniør ing, Fabric Data Science, Real-Time Intelligence, Data Factory og Power BI.

  • Element: Et element et sett med funksjoner i en opplevelse. Brukere kan opprette, redigere og slette dem. Hver elementtype har forskjellige funksjoner. For eksempel inkluderer Dataingeniør opplevelsen lakehouse, notatblokk og Spark jobbdefinisjonselementer.

  • Tenant: En leier er en enkelt forekomst av Fabric for en organisasjon og er justert med en Microsoft Entra ID.

  • Arbeidsområde: Et arbeidsområde er en samling elementer som samler ulike funksjoner i ett enkelt miljø som er utformet for samarbeid. Den fungerer som en beholder som bruker kapasitet for arbeidet som utføres, og gir kontroller for hvem som har tilgang til elementene i den. Brukere oppretter for eksempel rapporter, notatblokker, semantiske modeller osv. Hvis du vil ha mer informasjon, kan du se artikler om arbeidsområder .

Stoff Dataingeniør ing

  • Lakehouse: Et lakehouse er en samling filer, mapper og tabeller som representerer en database over en datainnsjø som brukes av Apache Spark-motoren og SQL-motoren for behandling av store data. Et lakehouse inneholder forbedrede funksjoner for ACID-transaksjoner når du bruker deltaformaterte tabeller med åpen kildekode. Lakehouse-elementet driftes i en unik arbeidsområdemappe i Microsoft OneLake. Den inneholder filer i ulike formater (strukturerte og ustrukturerte) organisert i mapper og undermapper. Hvis du vil ha mer informasjon, kan du se Hva er et innsjøhus?

  • Notatblokk: En stoffnotatblokk er et interaktivt programmeringsverktøy med flere språk med rike funksjoner. Som inkluderer redigeringskode og markdown, kjøring og overvåking av en Spark-jobb, visning og visualiseringsresultat og samarbeid med teamet. Det hjelper dataingeniører og dataforskere med å utforske og behandle data, og bygge maskinlæringseksperimenter med både kode og lavkodeopplevelse. Det kan enkelt transformeres til en datasamlebåndaktivitet for orkestrering.

  • Spark-program: Et Apache Spark-program er et program skrevet av en bruker som bruker et av Sparks API-språk (Scala, Python, Spark SQL eller Java) eller Microsoft-lagt til språk (.NET med C# eller F#). Når et program kjører, er det delt inn i én eller flere Spark-jobber som kjører parallelt for å behandle dataene raskere. Hvis du vil ha mer informasjon, kan du se Spark-programovervåking.

  • Apache Spark-jobb: En Spark-jobb er en del av et Spark-program som kjøres parallelt med andre jobber i programmet. En jobb består av flere aktiviteter. Hvis du vil ha mer informasjon, kan du se Spark-jobbovervåking.

  • Apache Spark-jobbdefinisjon: En Spark-jobbdefinisjon er et sett med parametere, angitt av brukeren, som angir hvordan et Spark-program skal kjøres. Den lar deg sende inn satsvise jobber eller strømmingsjobber til Spark-klyngen. Hvis du vil ha mer informasjon, kan du se Hva er en Apache Spark-jobbdefinisjon?

  • V-rekkefølge: En skriveoptimalisering til parkettfilformatet som muliggjør rask lesing og gir kostnadseffektivitet og bedre ytelse. Alle Fabric-motorene skriver v-bestilte parkettfiler som standard.

Data Factory

  • Kobling: Data Factory tilbyr et rikt sett med koblinger som lar deg koble til ulike typer datalagre. Når du er tilkoblet, kan du transformere dataene. Hvis du vil ha mer informasjon, kan du se koblinger.

  • Datasamlebånd: I Data Factory brukes et datasamlebånd til orkestrering av databevegelse og transformasjon. Disse datasamlebåndene er forskjellige fra utrullingssamlebåndene i Fabric. Hvis du vil ha mer informasjon, kan du se Pipelines i oversikten over Data Factory.

  • Dataflyt gen2: Dataflyter gir et grensesnitt med lav kode for inntak av data fra hundrevis av datakilder og transformering av dataene. Dataflyter i Fabric kalles Dataflyt gen2. Dataflyt gen1 finnes i Power BI. Dataflyt gen2 tilbyr ekstra funksjoner sammenlignet med dataflyter i Azure Data Factory eller Power BI. Du kan ikke oppgradere fra Gen1 til Gen2. Hvis du vil ha mer informasjon, kan du se Dataflyter i oversikten over Data Factory.

  • Utløser: En automatiseringsfunksjonalitet i Data Factory som starter datasamlebånd basert på bestemte betingelser, for eksempel tidsplaner eller datatilgjengelighet.

Fabric Data Science

  • Data Wrangler: Data Wrangler er et notatblokkbasert verktøy som gir brukerne en engasjerende opplevelse for å utføre utforskende dataanalyse. Funksjonen kombinerer en rutenettlignende datavisning med dynamisk sammendragsstatistikk og et sett med vanlige datarensingsoperasjoner, som alle er tilgjengelige med noen få valgte ikoner. Hver operasjon genererer kode som kan lagres tilbake til notatblokken som et gjenbrukbart skript.

  • Eksperiment: Et maskinlæringseksperiment er den primære enheten for organisering og kontroll for alle relaterte maskinlæringskjøringer. Hvis du vil ha mer informasjon, kan du se Maskinlæringseksperimenter i Microsoft Fabric.

  • Modell: En maskinlæringsmodell er en fil som er opplært til å gjenkjenne visse typer mønstre. Du lærer opp en modell over et sett med data, og du gir den en algoritme som den bruker til å resonnere og lære av dette datasettet. Hvis du vil ha mer informasjon, kan du se Maskinlæringsmodell.

  • Kjør: En kjøring tilsvarer en enkelt kjøring av modellkode. I MLflow er sporing basert på eksperimenter og kjøringer.

Fabric Data Warehouse

  • Endepunkt for SQL-analyse: Hvert Lakehouse har et SQL Analytics-endepunkt som gjør det mulig for en bruker å spørre deltatabelldata med TSQL over TDS. Hvis du vil ha mer informasjon, kan du se endepunktet for SQL-analyse.

  • Fabric Data Warehouse: Fabric Data Warehouse fungerer som et tradisjonelt datalager og støtter de fullstendige transaksjonelle T-SQL-funksjonene du forventer fra et virksomhetsdatalager. Hvis du vil ha mer informasjon, kan du se Fabric Data Warehouse.

Sanntidsinnsikt

  • Aktivator: Aktivator er et verktøy uten kode, med lav kode som lar deg opprette varsler, utløsere og handlinger på dataene dine. Aktivator brukes til å opprette varsler på datastrømmene. Hvis du vil ha mer informasjon, kan du se Activator.

  • Eventhouse: Eventhouses gir en løsning for håndtering og analyse av store mengder data, spesielt i scenarioer som krever sanntidsanalyse og utforskning. De er utformet for å håndtere datastrømmer i sanntid effektivt, noe som gjør det mulig for organisasjoner å innta, behandle og analysere data i nær sanntid. Et enkelt arbeidsområde kan inneholde flere eventhouses, et hendelseshus kan inneholde flere KQL-databaser, og hver database kan inneholde flere tabeller. Hvis du vil ha mer informasjon, kan du se Oversikt over Eventhouse.

  • Eventstream: Eventstreams-funksjonen for Microsoft Fabric gir et sentralisert sted i Fabric-plattformen for å fange opp, transformere og rute sanntidshendelser til destinasjoner med en no-code-opplevelse. En hendelsesstrøm består av ulike datakilder for strømming, inntaksmål og en hendelsesprosessor når transformasjonen er nødvendig. Hvis du vil ha mer informasjon, kan du se Microsoft Fabric eventstreams.

  • KQL-database: KQL-databasen inneholder data i et format som du kan kjøre KQL-spørringer mot. KQL-databaser er elementer under et eventhouse. Hvis du vil ha mer informasjon, kan du se KQL-database.

  • KQL-spørringssett: KQL-spørringssettet er elementet som brukes til å kjøre spørringer, vise resultater og manipulere spørringsresultater på data fra DataUtforsker-databasen. Spørringssettet inneholder databasene og tabellene, spørringene og resultatene. Med KQL-spørringssettet kan du lagre spørringer for fremtidig bruk, eller eksportere og dele spørringer med andre. Hvis du vil ha mer informasjon, kan du se Spørringsdata i KQL-spørringssettet

Sanntidshub

  • Sanntidshub: Sanntidshub er det eneste stedet for alle data i bevegelse på tvers av hele organisasjonen. Alle Microsoft Fabric-leiere klargjøres automatisk med huben. Hvis du vil ha mer informasjon, kan du se Oversikt over sanntidshuben.

OneLake

  • Snarvei: Snarveier er innebygde referanser i OneLake som peker til andre plasseringer i fillageret. De gir deg mulighet til å koble til eksisterende data uten å måtte kopiere dem direkte. Hvis du vil ha mer informasjon, kan du se OneLake-snarveier.