Upravit

Sdílet prostřednictvím


Použití moderních datových skladů pro malé a střední firmy

Azure Data Lake
Azure SQL Database
Microsoft Fabric

Tento článek popisuje několik způsobů, jak mohou malé a střední firmy modernizovat starší úložiště dat a prozkoumat nástroje a možnosti pro velké objemy dat, aniž by se rozšířily aktuální rozpočty a sady dovedností. Tato komplexní řešení datových skladů se bezproblémově integrují se službami Azure Machine Learning, Azure AI, Microsoft Power Platform, Microsoft Dynamics 365 a dalšími technologiemi Microsoftu. Tato řešení poskytují snadný vstupní bod pro plně spravovanou datovou platformu SaaS (software jako služba) v Microsoft Fabricu, která se může rozšířit s rostoucími potřebami.

SMB, které používají místní SQL Server pro řešení datových skladů do 500 GB, můžou tento model využít. Používají různé nástroje pro příjem dat do řešení datového skladu, včetně nástrojů SQL Server Integration Services (SSIS), Služba Analysis Services serveru SQL (SSAS), SLUŽBY SQL Server Reporting Services (SSRS), běžných uložených procedur SQL, externího extrakce, transformace a načítání (ETL) a extrakce, načítání, transformace (ELT), úloh agenta SQL Serveru a replikace snímků SQL. Operace synchronizace dat jsou obvykle založené na snímcích, provádějí se jednou denně a nemají požadavky na generování sestav v reálném čase.

Zjednodušená architektura

Diagram znázorňující zjednodušenou architekturu SMB

Stáhněte si soubor aplikace Visio s touto architekturou.

Koncepční příležitost k modernizaci zahrnuje přechod řešení starších datových skladů na kombinaci azure SQL Database, azure SQL Managed Instance a prostředků infrastruktury. Tato strategie zajišťuje širokou kompatibilitu s tradičním SQL Serverem a klientskými nástroji SQL, jako je SQL Server Management Studio (SSMS). Poskytuje také možnosti metodou "lift and shift" pro stávající procesy a vyžaduje minimální zvýšení dovedností týmu podpory. Toto řešení slouží jako počáteční krok k komplexní modernizaci, což organizaci umožňuje plně přijmout přístup k jezeru, jak se datový sklad rozšiřuje a sada dovedností týmu roste.

Architektura

Diagram znázorňující rozšířenou architekturu, která je navržená tak, aby vyhovovala budoucím potřebám

Stáhněte si soubor aplikace Visio s touto architekturou.

Starší datové sklady SMB můžou obsahovat několik typů dat:

  • Nestrukturovaná data, jako jsou dokumenty a grafika.

  • Částečně strukturovaná data, jako jsou protokoly, sdílené svazky clusteru, JSON a soubory XML.

  • Strukturovaná relační data, včetně databází, které používají uložené procedury pro aktivity ETL a ELT.

Tok dat

Následující tok dat odpovídá předchozímu diagramu. Ukazuje příjem dat zvoleného datového typu:

  1. Datové kanály infrastruktury nebo kanály Azure Data Factory orchestrují příjem transakčních dat do řešení datového skladu.

    • Kanály orchestrují tok migrovaných nebo částečně refaktorovaných starších databází a balíčků SSIS do služby SQL Database a spravované instance SQL. Tento přístup metodou "lift and shift" můžete rychle implementovat, což zajišťuje bezproblémový přechod z místního řešení SQL do budoucího prostředí SaaS fabric. Databáze můžete modernizovat postupně po přechodu a posunu.

    • Kanály můžou předávat nestrukturovaná, částečně strukturovaná a strukturovaná data do Azure Data Lake Storage pro centralizované úložiště a analýzu s jinými zdroji. Tento přístup použijte, když při vytváření dat získáte větší obchodní výhodu než přeformulování dat.

  2. Pomocí zdrojů dat Microsoft Dynamics 365 můžete vytvářet centralizované řídicí panely business intelligence (BI) na rozšířených datových sadách pomocí nástrojů pro analýzu bezserverové architektury Fabric. Sloučená a zpracovávaná data můžete přenést zpět do Dynamics a použít je k další analýze v rámci fabric.

  3. Data ze zdrojů streamování v reálném čase můžou vstoupit do systému prostřednictvím služby Azure Event Hubs nebo jiných streamovacích řešení. Pro zákazníky s požadavky na řídicí panel v reálném čase může Analýza infrastruktury v reálném čase tato data okamžitě analyzovat.

  4. Data je možné ingestovat do centralizované služby Fabric OneLake pro další analýzu, úložiště a vytváření sestav pomocí zástupců data Lake Storage. Tento proces umožňuje místní analýzu a usnadňuje příjem dat.

  5. Analytické nástroje bez serveru, jako jsou koncové body SQL Analytics a možnosti Sparku infrastruktury, jsou dostupné na vyžádání uvnitř prostředků infrastruktury a nevyžadují žádné zřízené prostředky. Nástroje pro analýzu bez serveru jsou ideální pro:

    • Aktivity ETL a ELT týkající se dat OneLake

    • Poskytování zlaté vrstvy architektury medailiónů sestavÁm Power BI prostřednictvím funkce DirectLake

    • Improvizované zkoumání datových věd ve formátu T-SQL nebo Pythonu

    • Počáteční vytváření prototypů entit datového skladu

Prostředky infrastruktury jsou úzce integrované s potenciálními uživateli datových sad s více zdroji, včetně front-endových sestav Power BI, Machine Learning, Power Apps, Azure Logic Apps, Azure Functions a webových aplikací služby Aplikace Azure Service.

Komponenty

  • Fabric je analytická služba, která kombinuje datové inženýrství, datové sklady, datové vědy a možnosti bi v reálném čase. V tomto řešení poskytují funkce přípravy dat Infrastruktury platformu pro spolupráci pro datové inženýry, datové vědce, datové analytiky a odborníky na BI. Tato klíčovou komponentu využívá bezserverové výpočetní moduly a poskytuje obchodní hodnotu generováním přehledů distribuovaných zákazníkům.

  • SQL Database a SQL Managed Instance jsou cloudové služby relačních databází. SQL Database a SQL Managed Instance používají SSMS k vývoji a údržbě starších artefaktů, jako jsou uložené procedury. V tomto řešení tyto služby hostují podnikový datový sklad a provádějí aktivity ETL a ELT pomocí uložených procedur nebo externích balíčků. SQL Database a SQL Managed Instance jsou prostředí paaS (platforma jako služba), která můžete použít ke splnění požadavků na vysokou dostupnost a zotavení po havárii. Nezapomeňte zvolit skladovou položku, která splňuje vaše požadavky. Další informace najdete v tématu Vysoká dostupnost služby SQL Database a vysoká dostupnost pro službu SQL Managed Instance.

  • SSMS je integrované prostředí pro správu infrastruktury SQL, které můžete použít k vývoji a údržbě starších artefaktů, jako jsou uložené procedury.

  • Event Hubs je platforma pro streamování dat v reálném čase a služba pro příjem událostí. Event Hubs se bezproblémově integruje s datovými službami Azure a dokáže ingestovat data odkudkoli.

Alternativy

  • Službu Azure IoT Hub můžete použít k nahrazení nebo doplnění služby Event Hubs. Zvolte své řešení na základě zdroje streamovaných dat a jestli potřebujete klonovat a obousměrnou komunikaci se zařízeními pro generování sestav.

  • Datové kanály Fabric můžete použít místo kanálů Data Factory pro integraci dat. Vaše rozhodnutí bude záviset na několika faktorech. Další informace najdete v tématu Získání z Azure Data Factory do služby Data Factory v prostředcích infrastruktury.

  • K ukládání podnikových dat můžete použít Službu Fabric Warehouse místo SLUŽBY SQL Database nebo SQL Managed Instance. Tento článek určuje prioritu času uvedení na trh pro zákazníky, kteří chtějí modernizovat své datové sklady. Další informace o možnostech úložiště dat pro Prostředky infrastruktury najdete v průvodci rozhodováním o prostředcích infrastruktury.

Podrobnosti scénáře

Když SMB modernizuje své místní datové sklady pro cloud, můžou buď využít nástroje pro velké objemy dat pro budoucí škálovatelnost, nebo používat tradiční řešení založená na SQL pro nákladovou efektivitu, snadnou údržbu a hladký přechod. Hybridní přístup poskytuje to nejlepší ze světů a umožňuje snadnou migraci stávajících datových aktiv při použití moderních nástrojů a funkcí umělé inteligence. SMB můžou udržovat své zdroje dat založené na SQL spuštěné v cloudu a podle potřeby je modernizovat.

Tento článek popisuje několik strategií pro msp pro modernizaci starších úložišť dat a prozkoumání nástrojů a možností pro velké objemy dat bez roztažení aktuálních rozpočtů a sad dovedností. Tato komplexní řešení datových skladů Azure se bezproblémově integrují s Azure a služby Microsoft, včetně služeb AI, Microsoft Dynamics 365 a Microsoft Power Platform.

Potenciální případy použití

  • Migrujte tradiční místní relační datový sklad, který je menší než 1 TB a používá balíčky SSIS k orchestraci uložených procedur.

  • Síť existujících dat Dynamics nebo Microsoft Power Platform Dataverse pomocí dávkových a v reálném čase zdrojů Data Lake

  • Používejte inovativní techniky pro interakci s centralizovanými daty Azure Data Lake Storage Gen2. Mezi tyto techniky patří bezserverová analýza, dolování znalostí, fúze dat mezi doménami a zkoumání dat koncových uživatelů, včetně Fabric Copilotu.

  • Nastavte společnosti elektronického obchodování tak, aby přijaly datový sklad pro optimalizaci provozu.

Toto řešení se nedoporučuje pro:

Důležité informace

Tyto aspekty implementují pilíře dobře architektuře Azure, což je sada hlavních principů, které je možné použít ke zlepšení kvality úlohy. Další informace naleznete v tématu Microsoft Azure Well-Architected Framework.

Optimalizace nákladů

Optimalizace nákladů se zabývá způsoby, jak snížit zbytečné výdaje a zlepšit efektivitu provozu. Další informace najdete v kontrolním seznamu pro kontrolu návrhu pro optimalizaci nákladů.

  • Cenová kalkulačka Azure umožňuje upravit hodnoty, abyste pochopili, jak vaše konkrétní požadavky ovlivňují náklady. Ukázku cen pro scénář datových skladů SMB najdete v cenové kalkulačce Azure.

  • Ceny služby SQL Database závisí na výpočetních úrovních a úrovních služeb, které zvolíte, a počtu virtuálních jader a jednotek databázových transakcí. Tento příklad popisuje jednu databázi se zřízenými výpočetními prostředky a osmi virtuálními jádry a předpokládá, že potřebujete spustit uložené procedury ve službě SQL Database.

  • Ceny služby Data Lake Storage Gen2 závisí na množství uložených dat a na tom, jak často data používáte. Ukázkové ceny zahrnují 1 TB úložiště dat a další transakční předpoklady. 1 TB odkazuje na velikost datového jezera a ne na velikost původní starší databáze.

  • Ceny prostředků infrastruktury závisí na ceně kapacity Fabric F nebo na ceně Premium na osobu. Bezserverové funkce využívají procesor a paměť z zakoupené vyhrazené kapacity.

  • Ceny služby Event Hubs závisí na zvolené úrovni, počtu zřízených jednotek propustnosti a přijatých příchozích přenosech dat. V příkladu se předpokládá, že jedna jednotka propustnosti ve vrstvě Standard zpracovává více než jeden milion událostí za měsíc.

Přispěvatelé

Tento článek spravuje Microsoft. Původně byla napsána následujícími přispěvateli.

Hlavní autor:

Pokud chcete zobrazit neveřejné profily LinkedIn, přihlaste se na LinkedIn.

Další kroky