Hvad er semantisk link?
Semantisk link er en funktion, der giver dig mulighed for at etablere en forbindelse mellem semantiske modeller og Synapse Data Science i Microsoft Fabric. Brug af semantisk link understøttes kun i Microsoft Fabric.
For Spark 3.4 og nyere er semantisk link tilgængeligt i standardkørslen, når du bruger Fabric, og det er ikke nødvendigt at installere det.
Kør følgende kommando for Spark 3.3 eller nedenfor eller for at opdatere til den nyeste version af semantisk link:
%pip install -U semantic-link
De primære mål for semantisk link er at:
- Gør det lettere at oprette forbindelse til data.
- Aktivér overførsel af semantiske oplysninger.
- Integrer problemfrit med etablerede værktøjer, som dataforskere bruger, f.eks . notesbøger.
Semantisk link hjælper dig med at bevare domæneviden om datasemantik på en standardiseret måde, der kan fremskynde dataanalyser og reducere fejl.
Semantisk linkdataflow
Det semantiske linkdataflow starter med semantiske modeller, der indeholder data og semantiske oplysninger. Semantisk link bygger bro mellem Power BI og Synapse Data Science-oplevelsen.
Semantisk link giver dig mulighed for at bruge semantiske modeller fra Power BI i Synapse Data Science-oplevelsen til at udføre opgaver som detaljeret statistisk analyse og forudsigende modellering med teknikker til maskinel indlæring. Du kan gemme outputtet fra dit datavidenskabelige arbejde i OneLake ved hjælp af Apache Spark og indtage det gemte output i Power BI ved hjælp af Direct Lake.
Power BI-forbindelse
En semantisk model fungerer som en enkelt tabelobjektmodel , der leverer pålidelige kilder til semantiske definitioner, f.eks. Power BI-målinger. Semantisk link opretter forbindelse til semantiske modeller i følgende økosystemer, hvilket gør det nemt for dataforskere at arbejde i det system, de er mest fortrolige med.
- Python pandas økosystem via SemPy Python-biblioteket.
- Apache Spark-økosystemet via den oprindelige Spark-connector. Denne implementering understøtter forskellige sprog, herunder PySpark, Spark SQL, R og Scala.
Anvendelse af semantiske oplysninger
Semantiske oplysninger i data omfatter Power BI-datakategorier, f.eks. adresse og postnummer, relationer mellem tabeller og hierarkiske oplysninger.
Disse datakategorier omfatter metadata, som semantisk link overfører til Synapse Data Science-miljøet for at aktivere nye oplevelser og vedligeholde dataafstamning.
Nogle eksempler på programmer med semantisk link omfatter:
- Intelligente forslag til indbyggede semantiske funktioner.
- Innovativ integration til at øge data med Power BI-målinger ved hjælp af tilføjelsesmålinger.
- Værktøjer til validering af datakvalitet baseret på relationerne mellem tabeller og funktionelle afhængigheder i tabeller.
Semantisk link er et effektivt værktøj, der gør det muligt for forretningsanalytikere at bruge data effektivt i et omfattende datavidenskabsmiljø.
Semantisk link faciliterer problemfrit samarbejde mellem dataforskere og forretningsanalytikere ved at fjerne behovet for at implementere forretningslogik, der er integreret i Power BI-målinger. Denne fremgangsmåde sikrer, at begge parter kan arbejde effektivt og produktivt og maksimere potentialet i deres datadrevne indsigt.
FabricDataFrame-datastruktur
FabricDataFrame er den primære datastruktur, som semantisk link bruger til at overføre semantiske oplysninger fra semantiske modeller til Synapse Data Science-miljøet.
Klassen FabricDataFrame
:
- Understøtter alle pandas-handlinger.
- Underklassificerer pandas DataFrame og tilføjer metadata, f.eks. semantiske oplysninger og afstamning.
- Viser semantiske funktioner og metoden til tilføjelsesmåling , der gør det muligt at bruge Power BI-målinger i datavidenskabelig arbejde.