Hva er semantisk kobling?
Semantisk kobling er en funksjon som lar deg etablere en forbindelse mellom semantiske modeller og Synapse Data Science i Microsoft Fabric. Bruk av semantisk kobling støttes bare i Microsoft Fabric.
For Spark 3.4 og nyere er semantisk kobling tilgjengelig i standard kjøretid når du bruker Fabric, og det er ikke nødvendig å installere den.
For Spark 3.3 eller under, eller hvis du vil oppdatere til den nyeste versjonen av semantisk kobling, kjører du følgende kommando:
%pip install -U semantic-link
De primære målene for semantisk kobling er å:
- Forenkle datatilkobling.
- Aktiver overføring av semantisk informasjon.
- Integrere sømløst med etablerte verktøy dataforskere bruker, for eksempel notatblokker.
Semantisk kobling hjelper deg med å bevare domenekunnskap om datasemantikk på en standardisert måte som kan øke hastigheten på dataanalyse og redusere feil.
Dataflyt for semantisk kobling
Dataflyten for semantisk kobling starter med semantiske modeller som inneholder data og semantisk informasjon. Semantisk kobling bygger bro mellom Power BI og Synapse Data Science-opplevelsen.
Semantisk kobling lar deg bruke semantiske modeller fra Power BI i Synapse Data Science-opplevelsen til å utføre oppgaver som detaljert statistisk analyse og prediktiv modellering med maskinlæringsteknikker. Du kan lagre utdataene fra datavitenskapsarbeidet i OneLake ved hjelp av Apache Spark, og innta de lagrede utdataene i Power BI ved hjelp av Direct Lake.
Power BI-tilkobling
En semantisk modell fungerer som én enkelt tabellobjektmodell som gir pålitelige kilder for semantiske definisjoner, for eksempel Power BI-mål. Semantisk kobling kobles til semantiske modeller i følgende økosystemer, noe som gjør det enkelt for dataforskere å jobbe i systemet de er mest kjent med.
- Python pandas økosystem, gjennom SemPy Python-biblioteket.
- Apache Spark økosystem, gjennom Spark native-koblingen. Denne implementeringen støtter ulike språk, inkludert PySpark, Spark SQL, R og Scala.
Programmer av semantisk informasjon
Semantisk informasjon i data omfatter Power BI-datakategorier som adresse og postnummer, relasjoner mellom tabeller og hierarkisk informasjon.
Disse datakategoriene består av metadata som semantisk kobling overføres til Synapse Data Science-miljøet for å aktivere nye opplevelser og vedlikeholde dataavstamming.
Noen eksempler på programmer for semantisk kobling inkluderer:
- Intelligente forslag til innebygde semantiske funksjoner.
- Nyskapende integrasjon for å øke data med Power BI-mål ved hjelp av tilleggsmål.
- Verktøy for validering av datakvalitet basert på relasjonene mellom tabeller og funksjonelle avhengigheter i tabeller.
Semantisk kobling er et kraftig verktøy som gjør det mulig for forretningsanalytikere å bruke data effektivt i et omfattende datavitenskapsmiljø.
Semantisk kobling forenkler sømløst samarbeid mellom dataforskere og forretningsanalytikere ved å eliminere behovet for å gjenopprette forretningslogikk innebygd i Power BI-mål. Denne tilnærmingen sikrer at begge parter kan arbeide effektivt og produktivt, noe som maksimerer potensialet i deres datadrevne innsikt.
FabricDataFrame-datastruktur
FabricDataFrame er den primære datastrukturen som semantisk kobling bruker til å overføre semantisk informasjon fra semantiske modeller til Synapse Data Science-miljøet.
Klassen FabricDataFrame
:
- Støtter alle pandaoperasjoner.
- Underklasser pandas DataFrame og legger til metadata, for eksempel semantisk informasjon og avstamming.
- Viser semantiske funksjoner og metoden for tilleggsmåling som lar deg bruke Power BI-mål i datavitenskapsarbeid.
Relatert innhold
- Utforsk referansedokumentasjonen for Python-semantisk koblingspakke (SemPy)
- Opplæring: Rengjøre data med funksjonelle avhengigheter
- Power BI-tilkobling med semantisk kobling og Microsoft Fabric
- Utforske og validere data ved hjelp av semantisk kobling
- Utforske og validere relasjoner i semantiske modeller