Co je Azure Data Catalog?
Důležité
Služba Azure Data Catalog byla vyřazena 15. května 2024.
Pro funkce katalogu dat použijte službu Microsoft Purview , která nabízí jednotné zásady správného řízení dat pro celá data.
Azure Data Catalog je plně spravovaná cloudová služba, která uživatelům umožňuje zjistit zdroje dat, které potřebují, a pochopit zdroje dat, které najdou. Zároveň Data Catalog pomáhá organizacím vytěžit více z jejich stávajících investic.
Pomocí katalogu Data Catalog můžou všichni uživatelé (analytik, datový vědec nebo vývojář) objevit, pochopit a využívat zdroje dat ve své oblasti dat. Data Catalog obsahuje crowdsourcingový model metadat a poznámek, takže každý může přispívat k vytváření zjistitelných a použitelných dat. Je to jediné centrální místo, kde všichni uživatelé organizace mohou přispívat svými znalostmi a vytvářet komunitu a kulturu dat.
Problémy zjišťování pro spotřebitele dat
Tradičně je zjišťování zdrojů podnikových dat organický proces založený na kmenových znalostech. Pro společnosti, které chtějí získat nejvyšší hodnotu ze svých informačních prostředků, tento přístup představuje mnoho výzev:
- Uživatelé nemusí vědět, že zdroj dat existuje, pokud s ním nepřijdou do kontaktu v rámci jiného procesu. Neexistuje žádné centrální umístění, kde jsou zaregistrované zdroje dat.
- Pokud uživatelé nepoznají umístění zdroje dat, nemůžou se k datům připojit pomocí klientské aplikace. Možnosti využití dat vyžadují, aby uživatelé znali připojovací řetězec nebo cestu.
- Pokud uživatelé nepoznají umístění dokumentace ke zdroji dat, nemůžou pochopit zamýšlené použití dat. Zdroje dat a dokumentace se můžou nacházet na různých místech a využívat je prostřednictvím různých prostředí.
- Pokud mají uživatelé dotazy týkající se informačního prostředku, musí vyhledat odborníka nebo tým odpovědný za příslušná data a zapojit tyto odborníky offline. Neexistuje žádné explicitní propojení mezi daty a odborníky, kteří mají perspektivy na jejich použití.
- Pokud uživatelé nepochopí proces žádosti o přístup ke zdroji dat, zjišťování zdroje dat a jeho dokumentace jim stále nepomůže získat přístup k datům.
Problémy zjišťování pro producenty dat
Přestože se spotřebitelé dat potýkají s těmito dříve popsanými výzvami, uživatelé odpovědní za vytváření a správu informačních prostředků se potýkají s vlastními výzvami:
- Zadávání poznámek ke zdrojům dat s popisnými metadaty je často ztráta času. Klientské aplikace obvykle popisy uložené ve zdroji dat ignorují.
- Vytváření dokumentace pro zdroje dat je také často ztráta času. Udržování dokumentace v synchronizaci se zdroji dat je průběžná odpovědnost. Uživatelé můžou mít důvěru v dokumentaci, která je považována za zastaralý.
- Vytváření a správa dokumentace pro zdroje dat je složitá a časově náročná. O to větší je výzva tuto dokumentaci učinit snadno dostupnou pro každého uživatele, který příslušný zdroj dat používá.
- Omezení přístupu ke zdrojům dat a zajištění, aby spotřebitelé dat věděli, jak požádat o přístup, je neustávající výzva.
Když se tyto výzvy zkombinují, představují významnou překážkou pro společnosti, které chtějí podněcovat a podporovat používání a pochopení podnikových dat.
Azure Data Catalog může pomoci
Data Catalog je určen k řešení těchto problémů a pomáhá podnikům získat větší hodnotu ze stávajících prostředků. Data Catalog činí zdroje dat snadno objevitelné a srozumitelné pro uživatele, kteří tato data spravují.
Data Catalog poskytuje službu na principu cloudu, do níž lze zaregistrovat zdroj dat. Data zůstávají uložena ve stávajícím umístění, ale do katalogu Data Catalog se přidá kopie metadat spolu s odkazem na umístění zdroje dat. Tato metadata jsou také indexována, aby byl každý zdroj dat snadno objevitelný prostřednictvím vyhledávání a aby byl srozumitelný uživatelům, kteří ho objevili.
Po zaregistrování zdroje dat je možné jeho metadata rozšířit. Metadata může přidat buď uživatel, který ho zaregistroval, nebo jinými uživateli v podniku. Každý uživatel může opatřit poznámkami zdroj dat tím, že přidá popisy, značky nebo další metadata, například dokumentaci a procesy pro žádosti o přístup ke zdroji dat. Tato popisná metadata doplňují strukturální metadata (například názvy sloupců a typy dat) zaregistrovaná ze zdroje dat.
Primárním účelem registrace zdrojů dat je zjišťování a porozumění zdrojům, a jejich používání. Podnikoví uživatelé mohou potřebovat data pro business intelligence, vývoj aplikací, datové vědy nebo jiný úkol, ve kterém jsou vyžadována správná data. Mohou využít zkušenosti s objevováním v katalogu Data Catalog, aby rychle našli data, která odpovídají jejich potřebám, pochopili je, vyhodnotili jejich vhodnost pro daný účel a využili je otevřením zdroje dat v upřednostňovaném nástroji.
Současně mohou uživatelé přispívat do katalogu označováním, dokumentováním a zadáváním poznámek ke zdrojům dat, které jsou již zaregistrovány. Mohou také registrovat nové zdroje dat, které lze poté objevit, pochopit a využít komunitou uživatelů katalogu.
Další informace o katalogu Data Catalog
Další informace o možnostech katalogu Data Catalog naleznete v tématu:
- Postup registrace zdrojů dat
- Zjišťování zdrojů dat
- Postup přidání poznámek ke zdrojům dat
- Postup dokumentování zdrojů dat
- Jak se připojit ke zdrojům dat
- Jak pracovat s velkým objemem dat
- Jak spravovat datové prostředky
- Jak nastavit obchodní glosář
- Nejčastější dotazy