Co je sémantický odkaz?
Sémantický odkaz je funkce, která umožňuje navázat spojení mezi sémantických modelů a Datová Věda Synapse v Microsoft Fabric. Použití sémantického odkazu je podporováno pouze v Microsoft Fabric.
Pro Spark 3.4 a vyšší je sémantický odkaz dostupný ve výchozím modulu runtime při použití prostředků infrastruktury a není potřeba ho nainstalovat.
V případě Sparku 3.3 nebo novějšího nebo aktualizaci na nejnovější verzi sémantického odkazu spusťte následující příkaz:
%pip install -U semantic-link
Hlavními cíli sémantického propojení jsou:
- Usnadnění připojení k datům
- Povolte šíření sémantických informací.
- Bezproblémová integrace se zavedenými nástroji, které používají datoví vědci, jako jsou poznámkové bloky.
Sémantický odkaz pomáhá zachovat znalosti domény o sémantice dat standardizovaným způsobem, který umožňuje zrychlit analýzu dat a snížit chyby.
Sémantický tok dat propojení
Sémantický tok dat propojení začíná sémantickými modely, které obsahují data a sémantické informace. Sémantické propojení překlenuje mezeru mezi Power BI a prostředím Synapse Datová Věda.
Sémantický odkaz umožňuje používat sémantické modely z Power BI v prostředí synapse Datová Věda k provádění úloh, jako je podrobná statistická analýza a prediktivní modelování pomocí technik strojového učení. Výstup své datové vědy můžete uložit do OneLake pomocí Apache Sparku a ingestovat uložený výstup do Power BI pomocí Direct Lake.
Připojení Power BI
Sémantický model slouží jako jeden tabulkový objektový model , který poskytuje spolehlivé zdroje pro sémantické definice, jako jsou míry Power BI. Sémantické propojení se připojuje k sémantickým modelům v následujících ekosystémech, což usnadňuje práci datových vědců v systému, který jsou obeznámeni.
- Ekosystém Knihovny Python pandas prostřednictvím knihovny SemPy Python.
- Ekosystém Apache Sparku prostřednictvím nativního konektoru Sparku Tato implementace podporuje různé jazyky, včetně PySpark, Spark SQL, R a Scala.
Použití sémantických informací
Sémantické informace v datech zahrnují kategorie dat Power BI, jako jsou adresy a PSČ, relace mezi tabulkami a hierarchické informace.
Tyto kategorie dat tvoří metadata, která se sémantické propojení rozšíří do prostředí Synapse Datová Věda, aby bylo možné nové prostředí a udržovat rodokmen dat.
Mezi příklady použití sémantického odkazu patří:
- Inteligentní návrhy předdefinovaných sémantických funkcí
- Inovativní integrace pro rozšiřování dat pomocí měr Power BI pomocí doplňkových měr
- Nástroje pro ověřování kvality dat na základě relací mezi tabulkami a funkčními závislostmi v tabulkách
Sémantický odkaz je výkonný nástroj, který obchodním analytikům umožňuje efektivně využívat data v komplexním prostředí datových věd.
Sémantické propojení usnadňuje bezproblémovou spolupráci mezi datovými vědci a obchodními analytiky tím, že eliminuje potřebu reimplementovat obchodní logiku vloženou do měr Power BI. Tento přístup zajišťuje, že obě strany budou moct efektivně a produktivně pracovat a maximalizovat tak potenciál svých přehledů řízených daty.
Datová struktura FabricDataFrame
FabricDataFrame je primární datová struktura, kterou sémantický odkaz používá k šíření sémantických informací z sémantických modelů do prostředí Synapse Datová Věda.
Třída FabricDataFrame
:
- Podporuje všechny operace pandas.
- Podtřídy datového rámce pandas a přidávají metadata, jako jsou sémantické informace a rodokmen.
- Zveřejňuje sémantické funkce a metodu doplňku, která umožňuje používat míry Power BI v práci datových věd.