Sémantická šíření dat z sémantických modelů
Při čtení sémantického modelu do objektu FabricDataFrame se k objektu FabricDataFrame automaticky připojí sémantické informace, jako jsou metadata a poznámky z sémantického modelu. V tomto článku se dozvíte, jak knihovna SemPy Python zachovává poznámky připojené k tabulkám a sloupcům sémantického modelu.
Sémantické šíření pro uživatele knihovny pandas
Knihovna SemPy Python je součástí funkce sémantického odkazu a obsluhuje uživatele knihovny pandas. SemPy podporuje operace, které pandas umožňuje provádět s vašimi daty.
SemPy také umožňuje rozšířit sémantická data z sémantických modelů, na kterých pracujete. Šířením sémantických dat můžete zachovat poznámky připojené k tabulkám a sloupcům v sémantickém modelu při provádění operací, jako jsou řezy, sloučení a zřetězení.
Datovou strukturu FabricDataFrame můžete vytvořit jedním ze dvou způsobů:
Tabulku nebo výstup míry můžete přečíst z sémantického modelu do objektu FabricDataFrame.
Při čtení ze sémantického modelu do objektu FabricDataFrame se metadata z Power BI automaticky hydratuje nebo naplní objektEm FabricDataFrame. Jinými slovy, FabricDataFrame zachovává sémantické informace z tabulek nebo měr modelu.
Data v paměti můžete použít k vytvoření datového rámce FabricDataFrame stejně jako u datových rámců pandas.
Při vytváření objektu FabricDataFrame z dat v paměti je nutné zadat název sémantického modelu, ze kterého může objekt FabricDataFrame načíst informace o metadatech.
Způsob, jakým SemPy zachovává sémantická data, se liší v závislosti na faktorech, jako jsou operace, které provádíte, a pořadí objektů FabricDataFrame, na kterých pracujete.
Sémantické šíření se sloučením
Když sloučíte dva objekty FabricDataFrame, pořadí datových rámců určuje, jak SemPy šíří sémantické informace.
Pokud jsou oba objekty FabricDataFrame opatřeny poznámkami, mají přednost metadata na úrovni tabulky levého objektu FabricDataFrame. Stejné pravidlo platí pro jednotlivé sloupce; anotace sloupců v levém prvku FabricDataFrame mají přednost před poznámkami sloupců v pravém datovém rámci.
Pokud je k objektu FabricDataFrame přidružen pouze jeden objekt FabricDataFrame, použije SemPy svá metadata. Stejné pravidlo platí pro jednotlivé sloupce; SemPy používá poznámky ke sloupcům, které jsou přítomné v anotovaném objektu FabricDataFrame.
Sémantické šíření pomocí zřetězení
Když zřetědíte více objektů FabricDataFrame, zkopíruje SemPy metadata z prvního objektu FabricDataFrame, který odpovídá názvu sloupce. Pokud existuje více shod a metadata nejsou stejná, SemPy vydá upozornění.
Můžete také rozšířit zřetězení objektů FabricDataFrame s běžnými datovými rámci pandas tak, že nejprve umístíte fabricDataFrame.
Sémantické šíření pro uživatele Sparku
Sémantické propojení nativního konektoru Spark hydratuje (nebo naplní) slovník metadat sloupce Spark. V současné době je podpora sémantického šíření omezená a podléhá interní implementaci způsobu šíření informací schématu Sparku. Například agregace sloupce odstraní metadata.