Sdílet prostřednictvím


Co je sémantický odkaz?

Sémantický odkaz je funkce, která umožňuje navázat spojení mezi sémantických modelů a Datová Věda Synapse v Microsoft Fabric. Použití sémantického odkazu je podporováno pouze v Microsoft Fabric.

  • Pro Spark 3.4 a vyšší je sémantický odkaz dostupný ve výchozím modulu runtime při použití prostředků infrastruktury a není potřeba ho nainstalovat.

  • V případě Sparku 3.3 nebo novějšího nebo aktualizaci na nejnovější verzi sémantického odkazu spusťte následující příkaz:

    %pip install -U semantic-link
    

Hlavními cíli sémantického propojení jsou:

  • Usnadnění připojení k datům
  • Povolte šíření sémantických informací.
  • Bezproblémová integrace se zavedenými nástroji, které používají datoví vědci, jako jsou poznámkové bloky.

Sémantický odkaz pomáhá zachovat znalosti domény o sémantice dat standardizovaným způsobem, který umožňuje zrychlit analýzu dat a snížit chyby.

Sémantický tok dat propojení začíná sémantickými modely, které obsahují data a sémantické informace. Sémantické propojení překlenuje mezeru mezi Power BI a prostředím Synapse Datová Věda.

Diagram znázorňující tok dat z Power BI do poznámkových bloků ve službě Synapse Datová Věda a zpět do Power BI

Sémantický odkaz umožňuje používat sémantické modely z Power BI v prostředí synapse Datová Věda k provádění úloh, jako je podrobná statistická analýza a prediktivní modelování pomocí technik strojového učení. Výstup své datové vědy můžete uložit do OneLake pomocí Apache Sparku a ingestovat uložený výstup do Power BI pomocí Direct Lake.

Připojení Power BI

Sémantický model slouží jako jeden tabulkový objektový model , který poskytuje spolehlivé zdroje pro sémantické definice, jako jsou míry Power BI. Sémantické propojení se připojuje k sémantickým modelům v následujících ekosystémech, což usnadňuje práci datových vědců v systému, který jsou obeznámeni.

  • Ekosystém Knihovny Python pandas prostřednictvím knihovny SemPy Python.
  • Ekosystém Apache Sparku prostřednictvím nativního konektoru Sparku Tato implementace podporuje různé jazyky, včetně PySpark, Spark SQL, R a Scala.

Použití sémantických informací

Sémantické informace v datech zahrnují kategorie dat Power BI, jako jsou adresy a PSČ, relace mezi tabulkami a hierarchické informace.

Tyto kategorie dat tvoří metadata, která se sémantické propojení rozšíří do prostředí Synapse Datová Věda, aby bylo možné nové prostředí a udržovat rodokmen dat.

Mezi příklady použití sémantického odkazu patří:

  • Inteligentní návrhy předdefinovaných sémantických funkcí
  • Inovativní integrace pro rozšiřování dat pomocí měr Power BI pomocí doplňkových měr
  • Nástroje pro ověřování kvality dat na základě relací mezi tabulkami a funkčními závislostmi v tabulkách

Sémantický odkaz je výkonný nástroj, který obchodním analytikům umožňuje efektivně využívat data v komplexním prostředí datových věd.

Sémantické propojení usnadňuje bezproblémovou spolupráci mezi datovými vědci a obchodními analytiky tím, že eliminuje potřebu reimplementovat obchodní logiku vloženou do měr Power BI. Tento přístup zajišťuje, že obě strany budou moct efektivně a produktivně pracovat a maximalizovat tak potenciál svých přehledů řízených daty.

Datová struktura FabricDataFrame

FabricDataFrame je primární datová struktura, kterou sémantický odkaz používá k šíření sémantických informací z sémantických modelů do prostředí Synapse Datová Věda.

Diagram znázorňující tok dat z konektorů do sémantických modelů do objektu FabricDataFrame do sémantických funkcí

Třída FabricDataFrame:

  • Podporuje všechny operace pandas.
  • Podtřídy datového rámce pandas a přidávají metadata, jako jsou sémantické informace a rodokmen.
  • Zveřejňuje sémantické funkce a metodu doplňku, která umožňuje používat míry Power BI v práci datových věd.