Korzystanie z usługi Azure Synapse Analytics z analizą w skali chmury
Usługa Azure Synapse Analytics to aprowizowana, zintegrowana usługa analizy, która przyspiesza czas wglądu w magazyny danych i systemy danych big data. Usługa Azure Synapse Analytics łączy w sobie:
- Najlepsze technologie SQL używane w magazynowaniu danych przedsiębiorstwa.
- Technologie platformy Spark używane na potrzeby danych big data.
- Przepływy pracy dla aplikacji danych (wyrównane do źródła) oraz procesy wyodrębniania, przekształcania i ładowania (ETL) lub wyodrębniania, ładowania i przekształcania (ELT).
Azure Synapse Studio to narzędzie w usłudze Azure Synapse, które zapewnia ujednolicone środowisko do zarządzania, monitorowania, kodowania i zabezpieczeń. Usługa Synapse Studio ma głęboką integrację z innymi usługami platformy Azure, takimi jak Power BI, Azure Cosmos DB i Azure Machine Learning.
Notatka
Ta sekcja ma na celu opisanie określonych konfiguracji specyficznych dla analizy w skali chmury. Jest to uzupełnienie oficjalnej dokumentacji usługi Azure Synapse Analytics .
Przegląd
Podczas początkowej konfiguracji strefy docelowej danych można wdrożyć jeden obszar roboczy usługi Azure Synapse Analytics do użycia przez wszystkich analityków i analityków danych. Możesz utworzyć więcej obszarów roboczych dla konkretnych integracji danych lub produktów danych.
Możesz potrzebować dodatkowych obszarów roboczych usługi Azure Synapse Analytics, jeśli Twój produkt danych musi zapewniać dostęp do ustandaryzowanych danych z zabezpieczeniami na poziomie wiersza i kolumny. Te obszary robocze można udostępnić w pulach usługi Azure Synapse. Zespoły produktów danych mogą wymagać własnego obszaru roboczego do tworzenia produktów danych oraz oddzielnego obszaru roboczego, który przeznaczony jest wyłącznie dla zespołów ds. produktów z ograniczonym dostępem do rozwoju.
Konfiguracja usługi Azure Synapse Analytics
Pierwszym krokiem wdrażania usługi Azure Synapse Analytics jest skonfigurowanie obszaru roboczego usługi Azure Synapse, który jest połączony z kontem usługi Microsoft Purview.
Sieć usługi Azure Synapse Analytics
Strefa docelowa danych tworzy obszary robocze z zarządzaną siecią wirtualną usługi Azure Synapse Analytics. Komunikacja z usługą Azure Synapse odbywa się za pośrednictwem trzech uwidacznianych punktów końcowych: puli SQL, bazy danych SQL na żądanie i punktu końcowego programowania.
Na poziomie sieci analiza w skali chmury używa zarządzanych przez Synapse prywatnych punktów końcowych . Te punkty końcowe zapewniają, że cały ruch między siecią wirtualną strefy lądowania danych a obszarami roboczymi Azure Synapse przechodzi całkowicie przez sieć szkieletową firmy Microsoft.
Kontrola dostępu do danych usługi Azure Synapse
Użyj list kontroli dostępu z Microsoft Entra pass-through w usłudze Azure Synapse Analytics, aby zarządzać dostępem do plików w jeziorze danych.
W przypadku danych, w których trzeba ograniczyć zwracane kolumny i wiersze, zalecamy użycie zabezpieczeń na poziomie wiersza i na poziomie kolumny, aby ograniczyć dostęp do danych w tabelach w dedykowanej lub bezserwerowej puli usługi Azure Synapse SQL. Zabezpieczenia na poziomie wiersza i zabezpieczenia na poziomie kolumn są implementowane na poziomie bazy danych i oprócz ról bazy danych.
Na przykład zabezpieczenia na poziomie wiersza zapewniają, że użytkownicy w określonej aplikacji danych (dopasowanej do źródła) lub produkcie danych widzą tylko własne dane. Nawet jeśli tabela zawiera dane dla całego przedsiębiorstwa.
Zabezpieczenia na poziomie wiersza można połączyć z zabezpieczeniami na poziomie kolumny, aby ograniczyć dostęp do kolumn z danymi poufnymi. W ten sposób zarówno zabezpieczenia na poziomie wiersza, jak i zabezpieczenia na poziomie kolumny stosują logikę ograniczeń dostępu w warstwie bazy danych, a nie warstwę aplikacji. Uprawnienie jest oceniane za każdym razem, gdy jest podejmowana próba dostępu do danych z dowolnej warstwy.
Notatka
Bezserwerowa pula SQL usługi Azure Synapse obsługuje zabezpieczenia na poziomie kolumny dla widoków, ale nie dla tabel zewnętrznych. W przypadku tabel zewnętrznych można utworzyć widok logiczny oparty na tabeli zewnętrznej, a następnie można zastosować zabezpieczenia na poziomie kolumn. W przypadku zabezpieczeń na poziomie wiersza można użyć widoków niestandardowych jako obejścia.
Aby uzyskać więcej informacji, zobacz kontrola dostępu do danych usługi Azure Synapse Analytics.
Kontrola dostępu do danych usługi Azure Synapse w usłudze Azure Data Lake
Podczas wdrażania obszaru roboczego Azure Synapse Analytics potrzebne jest konto Azure Data Lake Storage, które można pozyskać z subskrypcji lub ręcznie, używając adresu URL konta magazynu. Określone konto magazynowe zostało ustawione jako podstawowe dla wdrożonego obszaru roboczego usługi Azure Synapse do przechowywania jego danych. Usługa Azure Synapse przechowuje dane w kontenerze zawierającym tabele platformy Apache Spark i dzienniki aplikacji spark w folderze o nazwie /synapse/{workspaceName}
. Ma również kontener do zarządzania wszystkimi bibliotekami, które chcesz zainstalować.
Napiwek
Zalecamy użycie dedykowanego kontenera na warstwie rozwojowej lub w trzecim koncie jeziora danych. Ten kontener jest używany jako magazyn podstawowy do przechowywania metadanych platformy Spark.
Zapoznaj się z artykułem Kontrola dostępu do danych usługi Azure Synapse Analytics, aby uzyskać zalecenia dotyczące konfigurowania dostępu do danych.