Použití Azure Synapse Analytics s analýzami v cloudovém měřítku

Článek
12/14/2024

Azure Synapse Analytics je zřízená integrovaná analytická služba, která zrychluje dobu přehledu napříč datovými sklady a systémy pro velké objemy dat. Azure Synapse Analytics spojuje:

Nejlepší technologie SQL používané v podnikových datových skladech.
Technologie Sparku používané pro velké objemy dat
Kanály pro datovou aplikaci (v souladu se zdrojem) a extrakci, transformaci a načítání (ETL) nebo extrakci, načítání a transformaci (ELT).

Azure Synapse Studio je nástroj v Azure Synapse, který poskytuje jednotné prostředí pro správu, monitorování, kódování a zabezpečení. Synapse Studio má hlubokou integraci s dalšími službami Azure, jako jsou Power BI, Azure Cosmos DB a Azure Machine Learning.

Poznámka

Cílem této části je popsat předepsané konfigurace, které jsou specifické pro analýzy v cloudovém měřítku. Je to kompliment oficiální dokumentaci ke službě Azure Synapse Analytics.

Přehled

Během počátečního nastavení cílové zóny datmůžete nasadit jeden pracovní prostor Azure Synapse Analytics, který budou používat všichni analytici a datoví vědci. Můžete vytvořit více pracovních prostorů pro konkrétní integrace dat nebo datové produkty.

Možná budete potřebovat další pracovní prostory Azure Synapse Analytics, pokud váš datový produkt potřebuje poskytnout přístup k standardizovaným datům se zabezpečením na úrovni řádků a sloupců. Tyto pracovní prostory můžete poskytnout fondům Azure Synapse. Týmy datových produktů mohou vyžadovat vlastní pracovní prostor pro vytváření datových produktů a samostatný pracovní prostor, který je určený jenom pro produktové týmy s vymezeným přístupem pro vývoj.

Nastavení služby Azure Synapse Analytics

Prvním krokem při nasazení služby Azure Synapse Analytics je nastavení pracovního prostoru Azure Synapse, který je připojený k účtu Microsoft Purview.

Sítě Azure Synapse Analytics

Přistávací zóna dat vytváří pracovní prostory s spravovanou virtuální sítíAzure Synapse Analytics. Komunikace s Azure Synapse probíhá prostřednictvím tří koncových bodů, které zveřejňuje: fond SQL, SQL na vyžádání a koncový bod pro vývoj.

Analýzy v rozsahu cloudu na úrovni sítě používají privátní koncové body spravované službou Synapse. Tyto koncové body zajišťují veškerý provoz mezi virtuální sítí cílové zóny dat a pracovními prostory Azure Synapse zcela přes páteřní síť Microsoftu.

Řízení přístupu k datům Azure Synapse

Pomocí seznamů řízení přístupu průchodu Microsoft Entra v Azure Synapse Analytics spravovat přístup k souborům v datovém jezeře.

Pro data, u kterých je potřeba omezit vrácené sloupce a řádky, doporučujeme využití zabezpečení na úrovni řádků a sloupců k omezení přístupu k datům v tabulkách, které jsou ve vyhrazeném nebo bezserverovém fondu služby Azure Synapse SQL. Zabezpečení na úrovni řádků a zabezpečení na úrovni sloupců se implementuje na úrovni databáze a kromě databázových rolí.

Zabezpečení na úrovni řádků například zajišťuje, aby uživatelé v konkrétní datové aplikaci (zarovnané zdroji) nebo datovém produktu viděli jenom svá vlastní data. I když tabulka obsahuje data pro celý podnik.

Zabezpečení na úrovni řádků můžete kombinovat se zabezpečením na úrovni sloupců, abyste omezili přístup ke sloupcům s citlivými daty. Tímto způsobem platí, že zabezpečení na úrovni řádků i zabezpečení na úrovni sloupců používá logiku omezení přístupu na úrovni databáze místo aplikační vrstvy. Oprávnění se vyhodnocuje při každém pokusu o přístup k datům z libovolné vrstvy.

Poznámka

Bezserverový fond SQL Azure Synapse podporuje zabezpečení na úrovni sloupců pro zobrazení, a ne pro externí tabulky. V případě externích tabulek můžete vytvořit logické zobrazení nad externí tabulkou a použít zabezpečení na úrovni sloupce. V případě zabezpečení na úrovni řádků je možné jako alternativní řešení použít vlastní zobrazení.

Další informace najdete v tématu řízení přístupu k datům Azure Synapse Analytics.

Řízení přístupu k datům Azure Synapse v Azure Data Lake

Při nasazování pracovního prostoru Azure Synapse Analytics potřebujete účet Azure Data Lake Storage ze svého předplatného nebo ručně zadáním adresy URL účtu úložiště. Zadaný účet úložiště je nastavený jako primární pro nasazený pracovní prostor Azure Synapse pro ukládání dat. Azure Synapse ukládá data do kontejneru, který obsahuje tabulky Apache Sparku a protokoly aplikací Sparku ve složce s názvem /synapse/{workspaceName}. Má také kontejner pro správu všech knihoven, které se rozhodnete nainstalovat.

Spropitné

Doporučujeme použít vyhrazený kontejner ve vrstvě Development nebo data Lake tři účet. Tento kontejner se používá jako primární úložiště k ukládání metadat Sparku.

Podívejte se na doporučení ohledně nastavení přístupu k datům v dokumentu Řízení přístupu k datům v Azure Synapse Analytics.

Sdílet prostřednictvím