Semantisk dataoverføring fra semantiske modeller
Når du leser en semantisk modell i en FabricDataFrame, legges semantisk informasjon som metadata og merknader fra den semantiske modellen automatisk til FabricDataFrame. I denne artikkelen lærer du hvordan SemPy Python-biblioteket bevarer merknader som er knyttet til tabeller og kolonner for en semantisk modell.
Semantisk overføring for pandaer brukere
SemPy Python-biblioteket er en del av semantisk koblingsfunksjon og serverer pandas-brukere. SemPy støtter operasjonene som pandaer lar deg utføre på dataene dine.
SemPy lar deg også overføre semantiske data fra semantiske modeller som du opererer på. Ved å overføre semantiske data kan du bevare merknader som er knyttet til tabeller og kolonner i den semantiske modellen når du utfører operasjoner som oppdeling, fletting og sammenkobling.
Du kan opprette en FabricDataFrame-datastruktur på to måter:
Du kan lese en tabell eller utdataene fra et mål fra en semantisk modell til en FabricDataFrame.
Når du leser fra en semantisk modell til en FabricDataFrame, hydrerer metadataene fra Power BI automatisk, eller fyller ut FabricDataFrame. FabricDataFrame bevarer med andre ord semantisk informasjon fra modellens tabeller eller mål.
Du kan bruke minnedata til å opprette FabricDataFrame, akkurat som du gjør for pandas DataFrames.
Når du oppretter en FabricDataFrame fra minnedata, må du angi navnet på en semantisk modell som FabricDataFrame kan hente metadatainformasjon fra.
Måten SemPy bevarer semantiske data på varierer avhengig av faktorer som operasjonene du gjør og rekkefølgen på FabricDataFrames du opererer på.
Semantisk overføring med fletting
Når du slår sammen to FabricDataFrames, bestemmer rekkefølgen på DataFrames hvordan SemPy overfører semantisk informasjon.
Hvis begge FabricDataFrames er kommentert, har metadataene på tabellnivå for venstre FabricDataFrame prioritet. Den samme regelen gjelder for individuelle kolonner. kolonnemerknadene i venstre FabricDataFrame har forrang over kolonnemerknadene i høyre DataFrame.
Hvis bare én FabricDataFrame er kommentert, bruker SemPy metadataene. Den samme regelen gjelder for individuelle kolonner. SemPy bruker kolonnemerknadene som finnes i den kommenterte FabricDataFrame.
Semantisk overføring med sammenkobling
Når du kjeder sammen flere FabricDataFrame, kopierer SemPy metadataene for hver kolonne fra det første FabricDataFrame som samsvarer med kolonnenavnet. Hvis det finnes flere treff og metadataene ikke er like, utsteder SemPy en advarsel.
Du kan også overføre sammenkoblinger av FabricDataFrames med vanlige pandaer DataFrames ved å plassere FabricDataFrame først.
Semantisk overføring for Spark-brukere
Den semantiske koblingen Spark native connector hydrerer (eller fyller ut) metadataordlisten for en Spark-kolonne. For øyeblikket er støtte for semantisk overføring begrenset og underlagt Sparks interne implementering av hvordan skjemainformasjon overføres. Kolonneaggregasjon fjerner for eksempel metadataene.