Korzystanie z usługi Azure Synapse Analytics z analizą w skali chmury
Usługa Azure Synapse Analytics to aprowizowana, zintegrowana usługa analizy, która przyspiesza czas wglądu w magazyny danych i systemy danych big data. Usługa Azure Synapse Analytics łączy w sobie:
- Najlepsze technologie SQL używane w magazynowaniu danych przedsiębiorstwa.
- Technologie platformy Spark używane na potrzeby danych big data.
- Potoki dla aplikacji danych (wyrównane do źródła) i wyodrębniania, przekształcania i ładowania (ETL) lub wyodrębniania, ładowania i przekształcania (ELT).
Azure Synapse Studio to narzędzie w usłudze Azure Synapse, które zapewnia ujednolicone środowisko do zarządzania, monitorowania, kodowania i zabezpieczeń. Program Synapse Studio ma głęboką integrację z innymi usługami platformy Azure, takimi jak Power BI, Azure Cosmos DB i Azure Machine Edukacja.
Uwaga
Ta sekcja ma na celu opisanie określonych konfiguracji specyficznych dla analizy w skali chmury. Jest to komplement dla oficjalnej dokumentacji usługi Azure Synapse Analytics.
Omówienie
Podczas początkowej konfiguracji strefy docelowej danych można wdrożyć jeden obszar roboczy usługi Azure Synapse Analytics do użycia przez wszystkich analityków i analityków danych. Możesz utworzyć więcej obszarów roboczych dla konkretnych integracji danych lub produktów danych.
Może być konieczne dodatkowe obszary robocze usługi Azure Synapse Analytics, jeśli produkt danych musi zapewnić dostęp do ustandaryzowanych danych z zabezpieczeniami na poziomie wiersza i na poziomie kolumny. Te obszary robocze można udostępnić w pulach usługi Azure Synapse. Zespoły produktów danych mogą wymagać własnego obszaru roboczego do tworzenia produktów danych i oddzielnego obszaru roboczego, który jest przeznaczony tylko dla zespołów produktów z dostępem do programowania w zakresie.
Konfiguracja usługi Azure Synapse Analytics
Pierwszym krokiem wdrożenia usługi Azure Synapse Analytics jest skonfigurowanie obszaru roboczego usługi Azure Synapse połączonego z kontem usługi Azure Purview.
Sieć usługi Azure Synapse Analytics
Strefa docelowa danych tworzy obszary robocze z zarządzaną siecią wirtualną usługi Azure Synapse Analytics. Komunikacja z usługą Azure Synapse odbywa się za pośrednictwem trzech uwidacznianych punktów końcowych: puli SQL, bazy danych SQL na żądanie i punktu końcowego programowania.
Na poziomie sieci analiza w skali chmury używa zarządzanych prywatnych punktów końcowych usługi Synapse. Te punkty końcowe zapewniają cały ruch między siecią wirtualną strefy docelowej danych a obszarami roboczymi usługi Azure Synapse w całości przez sieć szkieletową firmy Microsoft.
Kontrola dostępu do danych usługi Azure Synapse
Użyj list kontroli dostępu z przekazywaniem firmy Microsoft w usłudze Azure Synapse Analytics , aby zarządzać dostępem do plików w usłudze Data Lake.
W przypadku danych, w których trzeba ograniczyć zwracane kolumny i wiersze, zalecamy użycie zabezpieczeń na poziomie wiersza i na poziomie kolumny, aby ograniczyć dostęp do danych w tabelach w dedykowanej lub bezserwerowej puli usługi Azure Synapse SQL. Zabezpieczenia na poziomie wiersza i zabezpieczenia na poziomie kolumn są implementowane na poziomie bazy danych i oprócz ról bazy danych.
Na przykład zabezpieczenia na poziomie wiersza zapewniają, że użytkownicy w określonej aplikacji danych (dopasowanej do źródła) lub produkcie danych widzą tylko własne dane. Nawet jeśli tabela zawiera dane dla całego przedsiębiorstwa.
Zabezpieczenia na poziomie wiersza można połączyć z zabezpieczeniami na poziomie kolumny, aby ograniczyć dostęp do kolumn z danymi poufnymi. W ten sposób zarówno zabezpieczenia na poziomie wiersza, jak i zabezpieczenia na poziomie kolumny stosują logikę ograniczeń dostępu w warstwie bazy danych, a nie warstwę aplikacji. Uprawnienie jest oceniane za każdym razem, gdy jest podejmowana próba dostępu do danych z dowolnej warstwy.
Uwaga
Bezserwerowa pula SQL usługi Azure Synapse obsługuje zabezpieczenia na poziomie kolumn dla widoków, a nie dla tabel zewnętrznych. W przypadku tabel zewnętrznych można utworzyć widok logiczny na wierzchu tabeli zewnętrznej i niż zastosować zabezpieczenia na poziomie kolumny. W przypadku zabezpieczeń na poziomie wiersza można użyć widoków niestandardowych jako obejścia.
Aby uzyskać więcej informacji, zobacz Azure Synapse Analytics data access control (Kontrola dostępu do danych w usłudze Azure Synapse Analytics).
Kontrola dostępu do danych usługi Azure Synapse w usłudze Azure Data Lake
Podczas wdrażania obszaru roboczego usługi Azure Synapse Analytics potrzebne jest konto usługi Azure Data Lake Storage z subskrypcji lub ręcznie przy użyciu adresu URL konta magazynu. Określone konto magazynu jest ustawione jako podstawowe dla wdrożonego obszaru roboczego usługi Azure Synapse w celu przechowywania danych. Usługa Azure Synapse przechowuje dane w kontenerze zawierającym tabele platformy Apache Spark i dzienniki aplikacji spark w folderze o nazwie /synapse/{workspaceName}
. Ma również kontener do zarządzania wszystkimi bibliotekami, które chcesz zainstalować.
Napiwek
Zalecamy użycie dedykowanego kontenera na trzy konto warstwy programowania lub usługi Data Lake . Ten kontener jest używany jako magazyn podstawowy do przechowywania metadanych platformy Spark.
Zapoznaj się z tematem Kontrola dostępu do danych usługi Azure Synapse Analytics, aby uzyskać zalecenia dotyczące konfigurowania dostępu do danych.