Sdílet prostřednictvím


Vizualizace a vytváření sestav pro migrace Netezza

Tento článek je čtvrtou částí sedmidílné série, která poskytuje pokyny k migraci z Netezza na Azure Synapse Analytics. Cílem tohoto článku jsou osvědčené postupy pro vizualizaci a vytváření sestav.

Přístup k Azure Synapse Analytics pomocí nástrojů BI od Microsoftu a třetích stran

Organizace přistupují k datovým skladům a datovým tržišti pomocí řady nástrojů a aplikací business intelligence (BI). Mezi příklady produktů BI patří:

  • Nástroje Microsoft BI, jako je Power BI.

  • Aplikace Office, jako jsou tabulky Microsoft Excelu.

  • Nástroje BI třetích stran od různých dodavatelů

  • Vlastní analytické aplikace s vloženými nástroji BI.

  • Provozní aplikace, které podporují BI na vyžádání, spouštěním dotazů a sestav na platformě BI, která následně dotazuje data v datovém skladu nebo datovém tržišti.

  • Interaktivní nástroje pro vývoj datových věd, jako jsou Azure Synapse Poznámkové bloky Spark, Azure Machine Learning, RStudio a Jupyter Notebooks.

Pokud migrujete vizualizaci a vytváření sestav v rámci migrace datového skladu, všechny stávající dotazy, sestavy a řídicí panely generované produkty BI musí běžet v novém prostředí. Vaše produkty BI musí na Azure Synapse poskytovat stejné výsledky jako ve starším prostředí datového skladu.

Pro zajištění konzistentních výsledků po migraci musí po migraci schématu datového skladu a dat do Azure Synapse fungovat všechny nástroje BI a závislosti aplikací. Závislosti zahrnují méně viditelné aspekty, jako je přístup a zabezpečení. Při řešení přístupu a zabezpečení se ujistěte, že migrujete:

  • Ověřování, aby se uživatelé mohli přihlásit k databázím datového skladu a datového tržiště na Azure Synapse.

  • Všichni uživatelé, kteří mají Azure Synapse.

  • Všechny skupiny uživatelů, které se mají Azure Synapse.

  • Všechny role, které se mají Azure Synapse.

  • Všechna oprávnění autorizace, která řídí řízení přístupu k Azure Synapse.

  • Přiřazení uživatelů, rolí a oprávnění k zrcadlení toho, co jste měli ve stávajícím datovém skladu před migrací. Příklad:

    • Oprávnění k objektu databáze přiřazená rolím
    • Role přiřazené skupinám uživatelů
    • Uživatelé přiřazení ke skupinám uživatelů nebo rolím

Přístup a zabezpečení jsou důležitými aspekty přístupu k datům v migrovaném systému a jsou podrobněji popsány v tématu Zabezpečení, přístup a operace pro migrace Netezza.

Tip

Aby byla migrace sestav a vizualizací úspěšná, je potřeba nejprve migrovat stávající uživatele, skupiny uživatelů, role a přiřazení oprávnění zabezpečení přístupu.

Migrujte všechna požadovaná data, abyste zajistili, že sestavy a řídicí panely, které se dotazují na data ve starším prostředí, generují stejné výsledky v Azure Synapse.

Firemní uživatelé budou očekávat bezproblémovou migraci bez překvapení, která by zničila jejich důvěru v migrovaný systém na Azure Synapse. Dbejte na to, abyste všechna obavy, které by vaši uživatelé mohli mít prostřednictvím dobré komunikace, dejte pozor. Vaši uživatelé budou očekávat, že:

  • Struktura tabulky zůstává stejná, pokud se na to přímo odkazuje v dotazech.

  • Názvy tabulek a sloupců zůstávají stejné, pokud jsou přímo odkazované v dotazech. Například počítaná pole definovaná u sloupců v nástrojích BI by neměla selhat při vytváření agregovaných sestav.

  • Historická analýza zůstává stejná.

  • Datové typy zůstávají stejné, pokud je to možné.

  • Chování dotazu zůstává stejné.

  • Ovladače ODBC/JDBC se testují, aby se zajistilo, že chování dotazů zůstává stejné.

Tip

Komunikace a zapojení podnikových uživatelů jsou pro úspěch zásadní.

Pokud se nástroje BI dotazují na zobrazení v podkladovém datovém skladu nebo databázi datového tržiště, budou tato zobrazení fungovat i po migraci? Některá zobrazení nemusí fungovat, pokud existují proprietární rozšíření SQL specifická pro vaši starší službu DBMS datového skladu, která nemají v Azure Synapse žádný ekvivalent. Pokud ano, potřebujete o těchto nekompatibilitě vědět a najít způsob, jak je vyřešit.

Tip

Zobrazení a dotazy SQL používající proprietární rozšíření dotazů SQL pravděpodobně způsobí nekompatibility, které mají vliv na sestavy a řídicí panely BI.

Jiné problémy, jako je chování hodnot nebo variací datových NULL typů napříč platformami DBMS, je potřeba otestovat, aby se zajistilo, že ve výsledcích výpočtů neexistují ani malé rozdíly. Minimalizujte tyto problémy a proveďte všechny nezbytné kroky, které chrání firemní uživatele před jejich ovlivněním. V závislosti na vašem starším prostředí datového skladu můžete použít nástroje třetích stran , které můžou skrýt rozdíly mezi starším a novým prostředím, aby se nástroje a aplikace BI spouštěly beze změny.

Testování je důležité pro vizualizaci a migraci sestav. Ke spouštění a opětovnému spuštění testů v obou prostředích potřebujete testovací sadu a dohodnutá testovací data. Testovací postroj je také užitečný a několik z nich je uvedeno v této příručce. Je také důležité zapojit podnikové uživatele do testovacího aspektu migrace, aby se zachovala vysoká důvěra a aby se zapojili do projektu.

Tip

Pomocí opakovatelných testů zajistíte úspěšnou migraci sestav, řídicích panelů a dalších vizualizací.

Možná přemýšlíte o přepnutí nástrojů BI, například k migraci do Power BI. Pokušením je provést takové změny současně s migrací schématu, dat, zpracování ETL a dalších. Pokud ale chcete minimalizovat riziko, je lepší nejprve migrovat na Azure Synapse a před provedením další modernizace vše zpracovat.

Pokud vaše stávající nástroje BI běží místně, ujistěte se, že se můžou připojit k Azure Synapse přes bránu firewall, abyste mohli spouštět porovnání s oběma prostředími. Případně, pokud dodavatel vašich stávajících nástrojů BI nabízí svůj produkt v Azure, můžete to vyzkoušet tam. Totéž platí pro aplikace spuštěné v místním prostředí, které vkládají BI nebo volají server BI na vyžádání, například tak, že si vyžádají "bezobrátovou sestavu" s daty XML nebo JSON.

Tady je hodně věcí, o které je potřeba přemýšlet, takže se pojďme podívat podrobněji.

Použití virtualizace dat k minimalizaci dopadu migrace na nástroje a sestavy BI

Během migrace můžete být v pokušení splnit dlouhodobé požadavky, jako je otevírání obchodních požadavků, přidávání chybějících dat nebo implementace nových funkcí. Tyto změny ale můžou ovlivnit přístup nástroje BI k datovému skladu, zejména pokud změna zahrnuje strukturální změny datového modelu. Pokud chcete použít agilní metodu modelování dat nebo implementovat strukturální změny, udělejte to po migraci.

Jedním ze způsobů, jak minimalizovat dopad změn schématu nebo jiných strukturálních změn na nástroje BI, je zavést virtualizaci dat mezi nástroji BI a datovým skladem a datovým tržištěm. Následující diagram znázorňuje, jak virtualizace dat může skrýt migraci před uživateli.

Diagram znázorňující, jak skrýt migraci před uživateli prostřednictvím virtualizace dat

Virtualizace dat přerušuje závislost mezi podnikovými uživateli využívajícími samoobslužné nástroje BI a fyzickým schématem podkladového datového skladu a datových tržišti, které se migrují.

Tip

Virtualizace dat umožňuje chránit firemní uživatele před strukturálními změnami během migrace, aby o těchto změnách nevěděli. Strukturální změny zahrnují změny schématu, které vylaďují datový model pro Azure Synapse.

Při virtualizaci dat můžou být jakékoli změny schématu provedené během migrace do Azure Synapse, například kvůli optimalizaci výkonu, skryty firemním uživatelům, protože mají přístup pouze k virtuálním tabulkám ve vrstvě virtualizace dat. A pokud provedete strukturální změny, stačí aktualizovat mapování mezi datovým skladem nebo datovými tržišti a všemi virtuálními tabulkami. Díky virtualizaci dat si uživatelé neuvědomují strukturální změny. Partneři Microsoftu poskytují software pro virtualizaci dat.

Nejprve identifikujte sestavy s vysokou prioritou, které se mají migrovat

Klíčovou otázkou při migraci stávajících sestav a řídicích panelů do Azure Synapse je, které sestavy a řídicí panely se mají migrovat jako první. Toto rozhodnutí může mít vliv na několik faktorů, například:

  • Využití

  • Obchodní hodnota

  • Usnadnění migrace

  • Strategie migrace dat

Následující části popisují tyto faktory.

Bez ohledu na vaše rozhodnutí se to musí týkat firemních uživatelů, protože vytvářejí sestavy, řídicí panely a další vizualizace a dělají obchodní rozhodnutí na základě přehledů z těchto položek. Všichni mají výhody, když můžete:

  • Bezproblémová migrace sestav a řídicích panelů
  • Migrace sestav a řídicích panelů s minimálním úsilím a
  • Nasměrujte své nástroje BI na Azure Synapse namísto staršího systému datového skladu a získejte sestavy, řídicí panely a další vizualizace podobného typu.

Migrace sestav na základě využití

Využití je často indikátorem obchodní hodnoty. Nepoužívané sestavy a řídicí panely zjevně nepřispívají k obchodním rozhodnutím nebo nabízejí aktuální hodnotu. Pokud nemáte způsob, jak zjistit, které sestavy a řídicí panely jsou nepoužívané, můžete použít některý z několika nástrojů BI, které poskytují statistiky využití.

Pokud je váš starší datový sklad zprovozněný už roky, je dobrá šance, že existují stovky, ne-li tisíce sestav. Stojí za to sestavit inventář sestav a řídicích panelů a identifikovat jejich obchodní účel a statistiky využití.

U nepoužívaných sestav určete, jestli je chcete vyřadit z provozu, aby se snížila náročnost migrace. Klíčovou otázkou při rozhodování o vyřazení nepoužívané sestavy z provozu je to, jestli je sestava nepoužitá, protože lidé nevědí, že existuje, protože nenabízí žádnou obchodní hodnotu, nebo je nahrazena jinou sestavou.

Migrace sestav na základě obchodní hodnoty

Samotné využití není vždy dobrým indikátorem obchodní hodnoty. Možná budete chtít zvážit, do jaké míry přehledy sestavy přispívají k obchodní hodnotě. Jedním ze způsobů, jak to udělat, je vyhodnotit ziskovost každého obchodního rozhodnutí, které závisí na zprávě, a rozsah závislosti. Ve většině organizací ale tyto informace pravděpodobně nebudou snadno dostupné.

Dalším způsobem, jak vyhodnotit obchodní hodnotu, je podívat se na soulad sestavy s obchodní strategií. Obchodní strategie nastavená vedoucími pracovníky obvykle stanoví strategické obchodní cíle, klíčové ukazatele výkonu (KPI), cíle klíčových ukazatelů výkonu, které je třeba dosáhnout, a to, kdo odpovídá za jejich dosažení. Sestavu můžete klasifikovat podle toho, ke kterým cílům na základě nasbíraných služeb sestava přispívá, například snížení počtu podvodů, lepší zapojení zákazníků a optimalizované obchodní operace. Pak můžete určit prioritu pro migraci sestav a řídicích panelů, které jsou přidruženy k cílům s vysokou prioritou. Počáteční migrace tak může přinést obchodní hodnotu ve strategické oblasti.

Dalším způsobem, jak vyhodnotit obchodní hodnotu, je klasifikovat sestavy a řídicí panely jako provozní, taktické nebo strategické, abyste zjistili, na jaké obchodní úrovni se používají. SPO vyžadují příspěvky na všech těchto úrovních. Když budete vědět, které sestavy a řídicí panely se používají, na jaké úrovni a k jakým cílům jsou přidružené, můžete se při počáteční migraci zaměřit na obchodní hodnotu s vysokou prioritou. K vyhodnocení sestav a řídicích panelů můžete použít následující tabulku cílů obchodní strategie .

Level Název sestavy nebo řídicího panelu Obchodní účel Použité oddělení Frekvence využití Obchodní priorita
Strategic
Taktické
Provoz

Nástroje pro zjišťování metadat, jako je Azure Data Catalog umožňují podnikovým uživatelům označit a hodnotit zdroje dat, aby se metadata těchto zdrojů dat obohatila a pomohla jim se zjišťováním a klasifikací. Metadata sestavy nebo řídicího panelu vám můžou pomoct pochopit jejich obchodní hodnotu. Bez těchto nástrojů bude pochopení příspěvku sestav a řídicích panelů k obchodní hodnotě pravděpodobně časově náročné, ať už migrujete, nebo ne.

Migrace sestav na základě strategie migrace dat

Pokud je vaše strategie migrace založená na migraci datových tržítků jako první, pořadí migrace datového tržiště bude mít vliv na to, které sestavy a řídicí panely se migrují jako první. Pokud je vaše strategie založená na obchodní hodnotě, bude pořadí migrace datových tržitek do Azure Synapse odrážet obchodní priority. Nástroje pro zjišťování metadat vám můžou pomoct implementovat vaši strategii tím, že vám ukážou, které tabulky datových tržišť poskytují data pro které sestavy.

Tip

Vaše strategie migrace dat má vliv na to, které sestavy a vizualizace se migrují jako první.

Problémy s nekompatibilitou migrace, které můžou ovlivnit sestavy a vizualizace

Nástroje BI vytvářejí sestavy, řídicí panely a další vizualizace vydáváním dotazů SQL, které přistupují k fyzickým tabulkám nebo zobrazením v datovém skladu nebo datovém tržišti. Při migraci staršího datového skladu do Azure Synapse může snadnost migrace sestav, řídicích panelů a dalších vizualizací ovlivnit několik faktorů. Mezi tyto faktory patří:

  • Nekompatibility schématu mezi prostředími.

  • Nekompatibility SQL mezi prostředími.

Nekompatibility schématu

Během migrace můžou být nekompatibility schématu v datovém skladu nebo tabulkách datových tržen, které poskytují data pro sestavy, řídicí panely a další vizualizace:

  • Nestandardní typy tabulek ve starším systému DBMS datového skladu, které nemají ekvivalent v Azure Synapse.

  • Datové typy ve starším datovém skladu DBMS, které nemají ekvivalent v Azure Synapse.

Ve většině případů existuje alternativní řešení nekompatibility. Můžete například migrovat data z nepodporovaného typu tabulky do standardní tabulky s příslušnými datovými typy a indexovat nebo dělit podle sloupce data a času. Podobně může být možné reprezentovat nepodporované datové typy v jiném typu sloupce a provádět výpočty v Azure Synapse, aby se dosáhlo stejných výsledků.

Tip

Mezi nekompatibility schématu patří starší typy tabulek DBMS skladu a datové typy, které Azure Synapse nepodporují.

Pokud chcete identifikovat sestavy ovlivněné nekompatibility schématu, spusťte dotazy na systémový katalog vašeho staršího datového skladu a identifikujte tabulky s nepodporovanými datovými typy. Pak můžete pomocí metadat z nástroje BI identifikovat sestavy, které přistupují k datům v těchto tabulkách. Další informace o tom, jak identifikovat nekompatibility typu objektu, najdete v tématu Nepodporované databázové typy objektů Netezza.

Tip

Zadejte dotaz do systémového katalogu starší verze dbms skladu a identifikujte nekompatibility schématu s Azure Synapse.

Nekompatibility schématu na sestavy, řídicí panely a další vizualizace můžou být menší, než si myslíte, protože mnoho nástrojů BI nepodporuje méně obecné datové typy. V důsledku toho váš starší datový sklad už může obsahovat zobrazení CAST nepodporovaných datových typů na obecnější typy.

Nekompatibility SQL

Během migrace budou nekompatibility SQL pravděpodobně mít vliv na sestavu, řídicí panel nebo jinou vizualizaci v aplikaci nebo nástroji, které:

  • Přistupuje ke starším zobrazením DBMS datového skladu, která obsahují proprietární funkce SQL, které nemají v Azure Synapse žádný ekvivalent.

  • Problémy s dotazy SQL, které zahrnují proprietární funkce SQL specifické pro dialekt SQL ve starší verzi prostředí, které nemají v Azure Synapse žádný ekvivalent.

Posouzení dopadu nekompatibility SQL na vaše portfolio sestav

Vaše portfolio sestav může zahrnovat vložené služby dotazů, sestavy, řídicí panely a další vizualizace. Nespoléhejte na dokumentaci přidruženou k těmto položkám, abyste mohli posoudit vliv nekompatibility SQL na migraci portfolia generování sestav do Azure Synapse. Musíte použít přesnější způsob, jak vyhodnotit účinek nekompatibility SQL.

Zjištění nekompatibility SQL pomocí příkazů EXPLAIN

Nekompatibility SQL můžete zjistit dotazem na _v_qryhist systémovou tabulku, abyste zobrazili nedávné aktivity SQL ve starším datovém skladu Netezza. Další informace najdete v tématu Tabulka historie dotazů. Pomocí skriptu extrahujte do souboru reprezentativní sadu příkazů SQL. Potom před každý příkaz SQL přidejte předponu EXPLAIN příkaz a spusťte tyto EXPLAIN příkazy v Azure Synapse. Všechny příkazy SQL obsahující proprietární nepodporovaná rozšíření SQL budou Azure Synapse při EXPLAIN spuštění příkazů odmítnuty. Tento přístup umožňuje posoudit rozsah nekompatibility SQL.

S identifikací nekompatibilních zobrazení vám můžou pomoct i metadata ze staršího datového skladu DBMS. Stejně jako předtím zachyťte reprezentativní sadu příkazů SQL, před každý příkaz SQL přidejte předponu EXPLAIN příkaz a spusťte tyto EXPLAIN příkazy v Azure Synapse, abyste identifikovali zobrazení s nekompatibilním SQL.

Tip

Změřte dopad nekompatibility SQL získáním souborů protokolů DBMS a spuštěných EXPLAIN příkazů.

Migrace sestavy a řídicího panelu do Azure Synapse Analytics

Klíčovým prvkem migrace datového skladu je testování sestav a řídicích panelů v Azure Synapse, aby se ověřilo, že migrace funguje. Definujte řadu testů a sadu požadovaných výsledků pro každý test, který spustíte, abyste ověřili úspěch. Otestujte a porovnejte sestavy a řídicí panely ve stávajících a migrovaných systémech datového skladu s následujícími možnostmi:

  • Zjistěte, jestli nějaké změny schématu provedené během migrace neovlivnily možnost spouštění sestav, výsledků sestav nebo odpovídajících vizualizací sestav. Příkladem změny schématu je namapování nekompatibilního datového typu na ekvivalentní datový typ podporovaný v Azure Synapse.

  • Ověřte, že se migrují všichni uživatelé.

  • Ověřte, že se migrují všechny role a že jsou k těmto rolím přiřazení uživatelé.

  • Ověřte, že se migrují všechna oprávnění zabezpečení přístupu k datům, aby se zajistila migrace seznamu řízení přístupu (ACL).

  • Zajistěte konzistentní výsledky pro všechny známé dotazy, sestavy a řídicí panely.

  • Ujistěte se, že je migrace dat a ETL dokončená a bez chyb.

  • Zajistěte dodržování ochrany osobních údajů v datech.

  • Testování výkonu a škálovatelnosti

  • Otestujte analytické funkce.

Tip

Otestujte a vylaďte výkon, abyste minimalizovali náklady na výpočetní prostředky.

Informace o migraci uživatelů, skupin uživatelů, rolí a oprávnění najdete v tématu Zabezpečení, přístup a operace pro migrace Netezza.

Co nejvíce automatizujte testování, aby byl každý test opakovatelný a podporoval konzistentní přístup k vyhodnocení výsledků testů. Automatizace funguje dobře pro známé pravidelné sestavy a je možné ji spravovat prostřednictvím kanálů Azure Synapse nebo Azure Data Factory orchestrace. Pokud už máte sadu testovacích dotazů pro regresní testování, můžete k automatizaci testování po migraci použít existující testovací nástroje.

Tip

Osvědčeným postupem je vytvořit automatizovanou sadu testů, aby byly testy opakovatelné.

Ad hoc analýza a vytváření sestav jsou náročnější a vyžadují kompilaci sady testů, aby se ověřilo, že stejné sestavy a řídicí panely před migrací a po migraci jsou konzistentní. Pokud zjistíte nekonzistence, bude vaše schopnost porovnávat rodokmen metadat v původním a migrovaném systému během testování migrace zásadní. Toto porovnání může zdůraznit rozdíly a určit, kde nekonzistence vznikla, pokud je detekce jinými prostředky obtížná.

Tip

K ověření výsledků využijte nástroje, které porovnávají rodokmen metadat.

Analýza rodokmenu pro pochopení závislostí mezi sestavami, řídicími panely a daty

Vaše znalost rodokmenu je zásadním faktorem úspěšné migrace sestav a řídicích panelů. Rodokmen je metadata, která zobrazují cestu migrovaných dat, abyste mohli sledovat jejich cestu ze sestavy nebo řídicího panelu až do zdroje dat. Rodokmen ukazuje, jak data putovala z bodu do bodu, jejich umístění v datovém skladu nebo datovém tržišti a které sestavy a řídicí panely je používají. Rodokmen vám pomůže pochopit, co se stane s daty, když prochází různými úložišti dat, jako jsou soubory a databáze, různé kanály ETL a do sestav. Když mají podnikoví uživatelé přístup k rodokmenu dat, zvyšuje to důvěru, vštěpuje důvěru a podporuje informovaná obchodní rozhodnutí.

Tip

Možnost získat přístup k metadatům a rodokmenu dat ze sestav až do zdroje dat je důležitá pro ověření správného fungování migrovaných sestav.

V prostředích datového skladu s více dodavateli můžou obchodní analytici v týmech BI mapovat rodokmen dat. Pokud například pro ETL, datový sklad a vytváření sestav používáte různé dodavatele a každý z nich má vlastní úložiště metadat, může být zjištění, odkud konkrétní datový prvek v sestavě pochází, náročné a časově náročné.

Tip

Nástroje, které automatizují shromažďování metadat a zobrazují kompletní rodokmen v prostředí s více dodavateli, jsou během migrace užitečné.

Pokud chcete bezproblémově migrovat ze staršího datového skladu do Azure Synapse, použijte kompletní rodokmen dat, abyste při porovnávání sestav a řídicích panelů vygenerovaných jednotlivými prostředími prokázali, že se migrace podobá podobné migraci. Pokud chcete zobrazit kompletní datovou cestu, budete muset zachytit a integrovat metadata z několika nástrojů. Přístup k nástrojům, které podporují automatizované zjišťování metadat a rodokmen dat, pomáhají identifikovat duplicitní sestavy nebo procesy ETL a najít sestavy, které se spoléhají na zastaralé, pochybné nebo neexistující zdroje dat. Tyto informace můžete použít ke snížení počtu sestav a procesů ETL, které migrujete.

Můžete také porovnat kompletní rodokmen sestavy v Azure Synapse s kompletním rodokmenem stejné sestavy ve starším prostředí a zkontrolovat rozdíly, ke kterým mohlo dojít neúmyslně během migrace. Tento typ porovnání je mimořádně užitečný, když potřebujete otestovat a ověřit úspěšnost migrace.

Vizualizace rodokmenu dat nejen zkracuje čas, úsilí a chyby v procesu migrace, ale také umožňuje rychlejší migraci.

Pomocí automatizovaných nástrojů pro zjišťování metadat a rodokmen dat, které porovnávají rodokmen, můžete ověřit, že sestava v Azure Synapse, která se vytváří z migrovaných dat, se ve starší verzi prostředí vytváří stejným způsobem. Tato funkce vám také pomůže určit:

  • Jaká data je potřeba migrovat, aby se zajistilo úspěšné provádění sestav a řídicích panelů v Azure Synapse.

  • Jaké transformace byly a měly by se provést, aby se zajistilo úspěšné spuštění v Azure Synapse.

  • Jak omezit duplicitu sestav.

Automatizované nástroje pro zjišťování metadat a rodokmen dat výrazně zjednodušují proces migrace, protože pomáhají podnikům lépe se seznámit s jejich datovými prostředky a zjistit, co je potřeba migrovat do Azure Synapse, aby se dosáhlo spolehlivého prostředí pro vytváření sestav.

Několik nástrojů ETL poskytuje komplexní funkce rodokmenu, takže zkontrolujte, jestli váš stávající nástroj ETL tuto funkci má, pokud ho plánujete používat s Azure Synapse. Azure Synapse kanály i Data Factory podporují možnost zobrazení rodokmenu v tocích mapování. Partneři Microsoftu také poskytují automatizované nástroje pro zjišťování metadat, rodokmen dat a porovnávání rodokmenů.

Migrace sémantických vrstev nástrojů BI do Azure Synapse Analytics

Některé nástroje BI mají tzv. sémantickou vrstvu metadat. Tato vrstva zjednodušuje podnikovým uživatelům přístup k podkladovým fyzickým datovým strukturám v datovém skladu nebo databázi datového tržiště. Vrstva sémantických metadat zjednodušuje přístup tím, že poskytuje objekty vysoké úrovně, jako jsou dimenze, míry, hierarchie, počítané metriky a spojení. Objekty vysoké úrovně používají obchodní termíny, které jsou známé obchodním analytikům, a mapují se na fyzické datové struktury v datovém skladu nebo datovém tržišti.

Tip

Některé nástroje BI mají sémantické vrstvy, které podnikovým uživatelům zjednodušují přístup k fyzickým datovým strukturám v datovém skladu nebo datovém tržišti.

Při migraci datového skladu se můžou vynucovat změny názvů sloupců nebo tabulek. Například v IBM Netezza můžou mít názvy tabulek "#". V Azure Synapse je "#" povoleno pouze jako předpona názvu tabulky, která označuje dočasnou tabulku. V IBM Netezza, DOČASNÉ TABULKY nemusí mít nutně "#" v názvu, ale v Synapse musí. V takových případech možná budete muset udělat nějakou změnu mapování tabulek.

Pokud chcete dosáhnout konzistence napříč několika nástroji BI, vytvořte univerzální sémantickou vrstvu pomocí serveru virtualizace dat, který je umístěn mezi nástroji BI a aplikacemi a Azure Synapse. Na serveru virtualizace dat používejte běžné názvy dat pro objekty vysoké úrovně, jako jsou dimenze, míry, hierarchie a spojení. Tímto způsobem nakonfigurujete všechno, včetně počítaných polí, spojení a mapování, pouze jednou místo v každém nástroji. Potom nasměrujte všechny nástroje BI na server virtualizace dat.

Tip

Pomocí virtualizace dat můžete vytvořit společnou sémantickou vrstvu, která zajistí konzistenci všech nástrojů BI v Azure Synapse prostředí.

Díky virtualizaci dat získáte konzistenci napříč všemi nástroji BI a přerušíte závislost mezi nástroji a aplikacemi BI a podkladovými fyzickými datovými strukturami v Azure Synapse. Partneři Microsoftu vám můžou pomoct dosáhnout konzistence v Azure. Následující diagram ukazuje, jak běžná slovní zásoba na serveru virtualizace dat umožňuje více nástrojům BI vidět společnou sémantickou vrstvu.

Diagram s běžnými názvy dat a definicemi, které souvisejí se serverem virtualizace dat

Závěry

Při migraci datového skladu lift and shift by se měla migrovat většina sestav, řídicích panelů a dalších vizualizací snadno.

Během migrace ze starší verze prostředí můžete zjistit, že data ve starších tabulkách datového skladu nebo datových tržišť jsou uložená v nepodporovaných datových typech. Nebo můžete najít starší zobrazení datového skladu, která zahrnují proprietární SQL bez ekvivalentu v Azure Synapse. Pokud ano, budete muset tyto problémy vyřešit, abyste zajistili úspěšnou migraci na Azure Synapse.

Nespoléhejte se na dokumentaci udržovanou uživatelem, abyste zjistili, kde se problémy nacházejí. Místo toho použijte EXPLAIN příkazy, protože představují rychlý a pragmatičtější způsob, jak identifikovat nekompatibility SQL. Přepracujte nekompatibilní příkazy SQL, abyste dosáhli ekvivalentních funkcí v Azure Synapse. Pomocí automatizovaných nástrojů pro zjišťování metadat a rodokmeny můžete také porozumět závislostem, najít duplicitní sestavy a identifikovat neplatné sestavy, které se spoléhají na zastaralé, pochybné nebo neexistující zdroje dat. Pomocí nástrojů rodokmenu můžete porovnat rodokmen a ověřit, že se sestavy spuštěné ve starším prostředí datového skladu vytvářejí stejně v Azure Synapse.

Nemigrujte sestavy, které už nepoužíváte. Data o využití nástrojů BI vám můžou pomoct určit, které sestavy se nepoužívají. Pro sestavy, řídicí panely a další vizualizace, které chcete migrovat, migrujte všechny uživatele, skupiny uživatelů, role a oprávnění. Pokud používáte obchodní hodnotu k řízení strategie migrace sestav, přidružte sestavy ke strategickým obchodním cílům a prioritám, které vám pomůžou identifikovat přínos přehledů sestav ke konkrétním cílům. Pokud migrujete datové tržiště pomocí datového tržiště, pomocí metadat identifikujte sestavy závislé na tabulkách a zobrazeních, abyste mohli informovaně rozhodnout, která datová tržiště se mají migrovat jako první.

Tip

Včas identifikujte nekompatibility, abyste mohli posoudit rozsah migrace. Migrace uživatelů, skupinových rolí a přiřazení oprávnění Migrujte jenom sestavy a vizualizace, které se používají a přispívají k obchodní hodnotě.

Během migrace může dojít ke strukturálním změnám datového modelu datového skladu nebo datového tržiště. Zvažte použití virtualizace dat k ochraně nástrojů a aplikací BI před strukturálními změnami. Díky virtualizaci dat můžete k definování společné sémantické vrstvy použít společnou slovní zásobu. Společná sémantická vrstva zaručuje konzistentní běžné názvy dat, definice, metriky, hierarchie a spojení napříč všemi nástroji a aplikacemi BI v novém prostředí Azure Synapse.

Další kroky

Další informace o minimalizaci problémů s SQL najdete v dalším článku v této sérii: Minimalizace problémů s SQL pro migrace Netezza.