Demokratizace dat pomocí digitálního vynálezu
Uhlí, olej a lidský potenciál byly tři nejvýraznější aktiva během průmyslové revoluce. Tyto aktivy postavily společnosti, změnily trhy a nakonec změnily státy. V digitální ekonomice existují tři stejně důležité prostředky pro inovace: data, zařízení a lidský potenciál. Tyto prostředky mají velký potenciál inovací. Pro všechny inovace v moderní éře jsou data novým olejem.
V každé společnosti existují data, která je možné použít k vyhledání a splnění potřeb zákazníků. Proces dolování dat, který má podpořit inovace, může být bohužel nákladný a časově náročný, takže potřeby se nezjistí a řešení se nevytvořijí. Demokratizace dat může tento problém vyřešit.
Co je demokratizace dat? Je to proces získávání dat do správných rukou, aby se řídily inovace. Tento proces demokratizace může mít několik forem, ale obecně zahrnují řešení pro ingestované nebo integrované nezpracovaná data, centralizaci dat, sdílení dat a zabezpečení dat. Když jsou data demokratizovaná, můžou je odborníci kolem společnosti použít k vytvoření a testování hypotéz. V mnoha případech můžou týmy přechodu na cloud vytvářet s využitím zákaznických empatií pouze dat, aby rychle splňovaly potřeby zákazníků.
Způsoby demokratizace dat
Existují různé způsoby demokratizace dat, ale většina zahrnuje metody shromažďování, centralizace, řízení a sdílení dat. Některé z těchto metod jsou popsány v následujících částech. Když vytváříte řešení pro hypotézu zákazníka, měli byste posoudit, jestli se mají demokratizovat data, v jakém rozsahu a jak to udělat.
Sdílení dat
Když vytváříte s empatií zákazníků, musí zákazník řešení řídit. Pokud jsou potřeba data, řešení umožňuje zákazníkovi přímo analyzovat, analyzovat a hlásit data bez podpory pracovníků IT.
Řada úspěšných inovací začíná jako minimální realizovatelný produkt (MVP), který zákazníkům poskytuje data. MVP je verze produktu, která má jenom dostatek funkcí, které může zákazník použít. Ukazuje možný potenciál produktu, aby mohl shromáždit zpětnou vazbu od zákazníka. V tomto modelu concierge je zaměstnanec příjemcem dat. Tento zaměstnanec používá data k podpoře zákazníka. Pokaždé, když zákazník provede ruční podporu, může být hypotéza testována a ověřena. Tento přístup je často nákladově efektivní způsob testování hypotézy zaměřené na zákazníky, než budete investovat do integrovaných řešení.
Mezi primární nástroje pro přímé sdílení dat s uživateli dat patří samoobslužné generování sestav nebo data vložená do jiných prostředí pomocí nástrojů, jako je Power BI.
Poznámka:
Před sdílením dat se ujistěte, že jste si přečetli následující části. Sdílení dat může vyžadovat zásady správného řízení k zajištění ochrany dat. Pokud jsou data rozložená do více cloudů, může to vyžadovat centralizaci. Pokud se data nacházejí v aplikacích, musíte je shromáždit, abyste je mohli sdílet.
Řízení dat
Sdílení dat může rychle vytvořit minimální realizovatelný produkt, který se použije v konverzacích zákazníků. Pokud ale chcete tato sdílená data převést na užitečné a použitelné znalosti, je obecně potřeba více.
Po ověření hypotézy prostřednictvím sdílení dat je další fází vývoje obvykle zásady správného řízení dat.
Zásady správného řízení dat jsou široké téma, které může vyžadovat vlastní vyhrazenou architekturu, záležitost, která je mimo rozsah architektury přechodu na cloud.
Při ověřování hypotézy zákazníka je potřeba zvážit několik aspektů zásad správného řízení dat. Příklad:
- Jsou sdílená data citlivá? Data by se měla klasifikovat před tím, než budou veřejně sdílena, aby se chránily zájmy zákazníků a společnosti.
- Pokud jsou citlivá data, byla zabezpečená? Ochrana citlivých dat je nutností demokratizovaných dat. Ukázková úloha probíraná v řešení zabezpečení dat poskytuje některé odkazy na zabezpečení dat.
- Jsou data v katalogu? Identifikace povahy sdílených dat pomáhá při dlouhodobé správě dat. Nástroje pro dokumentaci dat, jako je Azure Data Catalog, usnadňují tento proces v cloudu. Pokyny týkající se poznámek k datům a dokumentaci ke zdrojům dat můžou proces urychlit.
Pokud je demokratizace dat důležitá pro hypotézu zaměřenou na zákazníka, ujistěte se, že zásady správného řízení sdílených dat jsou v plánu vydání. Tím se chrání zákazníci, spotřebitelé dat a společnost.
Centralizace dat
Centralizace dat vede k smysluplnějšímu vytváření sestav, zajišťuje, že stejná data jsou k dispozici v celé organizaci, a zvyšuje návratnost návratnosti dat. Když jsou data rozptýlená v it prostředí, můžou být příležitosti k inovacím extrémně omezené, nákladné a časově náročné. Cloud poskytuje nové příležitosti k centralizaci dat. Když se vyžaduje centralizace více zdrojů dat k sestavení s empatií zákazníka, cloud může urychlit testování hypotéz.
Upozornění
Centralizace dat představuje rizikový bod v jakémkoli procesu inovací. Pokud je centralizace dat technická špička, a ne zdroj hodnoty zákazníka, doporučujeme, abyste zpozdili centralizaci, dokud se neověří hypotéza zákazníka.
Při centralizaci potřebujete vhodné úložiště dat pro centralizovaná data. Osvědčeným postupem je vytvořit datový sklad v cloudu. Tato škálovatelná možnost poskytuje centrální umístění pro všechna vaše data. Tento typ řešení je k dispozici v možnostech online analytického zpracování (OLAP) nebo velkých objemů dat.
Referenční architektury pro řešení OLAP a velké objemy dat vám můžou pomoct zvolit nejvhodnější řešení centralizace v Azure. Pokud se vyžaduje hybridní řešení, může referenční architektura pro rozšíření místních dat pomoct také zrychlit vývoj řešení.
Důležité
U některých zákaznických potřeb a řešení může být dostatečný jednoduchý přístup. Cloudový architekt by měl vyzvat tým, aby zvážil nízkonákladová řešení, aby ověřil hypotézu zákazníka, zejména v rané fázi vývoje. Tato část o shromažďování dat popisuje scénáře, které by mohly navrhnout jiné řešení pro vaši situaci.
Shromažďování dat
Dvě primární formy shromažďování dat jsou integrace a příjem dat.
Integrace: Data, která se nacházejí v existujícím úložišti dat, je možné integrovat do centralizovaného úložiště dat pomocí tradičních technik přesunu dat. To je zvlášť běžné pro scénáře, které zahrnují vícecloudové úložiště dat. Tyto techniky zahrnují extrakci dat z existujícího úložiště dat a jejich následné načtení do centrálního úložiště dat. V určitém okamžiku tohoto procesu se data obvykle transformují tak, aby byla v centrálním úložišti lépe použitelná a relevantní.
Cloudové nástroje tyto techniky změnily na nástroje pro průběžné platby, což snižuje vstupní bariéru pro shromažďování a centralizaci dat. Mezi dva příklady patří nástroje, jako je Azure Database Migration Service a Azure Data Factory . Referenční architektura služby Data Factory s úložištěm dat OLAP je příkladem jednoho takového řešení.
Příjem dat: Některá data se nenachází v existujícím úložišti dat. Pokud jsou tato přechodná data primárním zdrojem inovací, budete chtít zvážit alternativní přístupy. Přechodná data se dají najít v různých existujících zdrojích, jako jsou aplikace, rozhraní API, datové proudy, zařízení IoT, blockchain, mezipaměť aplikací, mediální obsah nebo dokonce ploché soubory.
Tyto různé formy dat můžete integrovat do centrálního úložiště dat v řešení OLAP nebo velkých objemů dat. V případě počátečních iterací cyklu sestavení-měření-učení však může být k ověření zákaznické hypotézy dostačující řešení pro online transakční zpracování (OLTP). Řešení OLTP nejsou nejlepší volbou pro žádný scénář vytváření sestav. Pokud ale vytváříte empatii se zákazníky, je důležitější zaměřit se na potřeby zákazníků než na technická rozhodnutí. Po ověření hypotézy zákazníka ve velkém měřítku se může vyžadovat vhodnější platforma. Referenční architektura úložišť dat OLTP vám může pomoct určit, které úložiště dat je pro vaše řešení nejvhodnější.
Virtualizace: Integrace a příjem dat může někdy zpomalit inovace. Pokud už je řešení virtualizace dat k dispozici, může představovat vhodnější přístup. Příjem dat a integrace můžou duplikovat požadavky na úložiště i vývoj, přidat latenci dat, zvýšit prostor pro útoky, aktivovat problémy s kvalitou a zvýšit úsilí o zásady správného řízení. Virtualizace dat je modernější alternativou, která ponechá původní data v jednom umístění a vytváří předávací nebo uložené dotazy do mezipaměti zdrojových dat.
SQL Server 2017 i Azure SQL Data Warehouse podporují PolyBase, což je přístup k virtualizaci dat, který se v Azure nejčastěji používá.
Další kroky
Při použití strategie demokratizace dat budete chtít dále vyhodnotit přístupy k vývoji aplikací.