Sdílet prostřednictvím


Sémantická šíření dat z sémantických modelů

Při čtení sémantického modelu do objektu FabricDataFrame se k objektu FabricDataFrame automaticky připojí sémantické informace, jako jsou metadata a poznámky z sémantického modelu. V tomto článku se dozvíte, jak knihovna SemPy Python zachovává poznámky připojené k tabulkám a sloupcům sémantického modelu.

Sémantické šíření pro uživatele knihovny pandas

Knihovna SemPy Python je součástí funkce sémantického odkazu a obsluhuje uživatele knihovny pandas. SemPy podporuje operace, které pandas umožňuje provádět s vašimi daty.

SemPy také umožňuje rozšířit sémantická data z sémantických modelů, na kterých pracujete. Šířením sémantických dat můžete zachovat poznámky připojené k tabulkám a sloupcům v sémantickém modelu při provádění operací, jako jsou řezy, sloučení a zřetězení.

Datovou strukturu FabricDataFrame můžete vytvořit jedním ze dvou způsobů:

  • Tabulku nebo výstup míry můžete přečíst z sémantického modelu do objektu FabricDataFrame.

    Při čtení ze sémantického modelu do objektu FabricDataFrame se metadata z Power BI automaticky hydratuje nebo naplní objektEm FabricDataFrame. Jinými slovy, FabricDataFrame zachovává sémantické informace z tabulek nebo měr modelu.

  • Data v paměti můžete použít k vytvoření datového rámce FabricDataFrame stejně jako u datových rámců pandas.

    Při vytváření objektu FabricDataFrame z dat v paměti je nutné zadat název sémantického modelu, ze kterého může objekt FabricDataFrame načíst informace o metadatech.

Způsob, jakým SemPy zachovává sémantická data, se liší v závislosti na faktorech, jako jsou operace, které provádíte, a pořadí objektů FabricDataFrame, na kterých pracujete.

Sémantické šíření se sloučením

Když sloučíte dva objekty FabricDataFrame, pořadí datových rámců určuje, jak SemPy šíří sémantické informace.

  • Pokud jsou oba objekty FabricDataFrame opatřeny poznámkami, mají přednost metadata na úrovni tabulky levého objektu FabricDataFrame. Stejné pravidlo platí pro jednotlivé sloupce; anotace sloupců v levém prvku FabricDataFrame mají přednost před poznámkami sloupců v pravém datovém rámci.

  • Pokud je k objektu FabricDataFrame přidružen pouze jeden objekt FabricDataFrame, použije SemPy svá metadata. Stejné pravidlo platí pro jednotlivé sloupce; SemPy používá poznámky ke sloupcům, které jsou přítomné v anotovaném objektu FabricDataFrame.

Sémantické šíření pomocí zřetězení

Když zřetědíte více objektů FabricDataFrame, zkopíruje SemPy metadata z prvního objektu FabricDataFrame, který odpovídá názvu sloupce. Pokud existuje více shod a metadata nejsou stejná, SemPy vydá upozornění.

Můžete také rozšířit zřetězení objektů FabricDataFrame s běžnými datovými rámci pandas tak, že nejprve umístíte fabricDataFrame.

Sémantické šíření pro uživatele Sparku

Sémantické propojení nativního konektoru Spark hydratuje (nebo naplní) slovník metadat sloupce Spark. V současné době je podpora sémantického šíření omezená a podléhá interní implementaci způsobu šíření informací schématu Sparku. Například agregace sloupce odstraní metadata.