Freigeben über


Häufig gestellte Fragen zu Analysen auf Cloudebene

Im Folgenden finden Sie häufig gestellte Fragen zu Analysen auf Cloudebene.

Speicherkonten

Warum benötige ich drei separate Speicherkonten? Kann ich nicht nur eins mit drei Containern für jede Ebene (roh, verbessert und zusammengestellt) nutzen?

Die meisten Datenanalysemuster bestehen heute aus den drei Ebenen roh, weiterentwickelt und zusammengestellt. Obwohl sie im selben Speicher behalten werden können, führt dies bei großen Implementierungen zu Problemen mit der Überschreitung der Anzahl der zulässigen Berechtigungen für die rollenbasierte Zugriffssteuerung (Role-Based Access Control, RBAC) und Zugriffssteuerungsliste (Access Control List, ACL), die innerhalb eines einzelnen Speicherkontos verfügbar sind. Wenn Sie separate Speicherkonten verwenden, können die meisten Implementierungen dieses Problem vermeiden.

Weitere Gründe werden unter Übersicht über Azure Data Lake Storage für die Analyse auf Coudebene erläutert.

Databricks

Sollte ein Azure Databricks Arbeitsbereich pro Produkt bereitgestellt werden?

Es wird empfohlen, das freigegebene Produkt Azure Databricks Analytics- und Data Science-Arbeitsbereich in der Zielzone zu verwenden.

Diese Entscheidung wurde getroffen, um den Verwaltungsaufwand für das Betriebsteam der Datenplattform zu reduzieren. Azure Databricks verfügt über eine Reihe eigenständiger Richtlinien, die nicht in die Azure-Richtlinien integriert sind. In einer großen Umgebung führt die Einrichtung von mehr Azure Databricks-Arbeitsbereichen zu mehr Verwaltungsaufwand. Beispiel: Das Verwalten von Richtlinien und unterstützten Apache Hive Versionen, das Aktualisieren von ADB-Versionen und das Erzwingen externer Apache Hive-Metastore. Es gibt keine Möglichkeit für ein zentrales Plattformteam, bestimmte Einstellungen in einem der Databricks-Arbeitsbereiche zu erzwingen. Es wird empfohlen, die freigegebenen Arbeitsbereiche für die Produktteams in den Zielzonen zu verwenden, in denen die operativen Teams der Datenplattform dann die erforderlichen Clusterrichtlinien und Initialisierungsskripts definieren können.

Es wird empfohlen, VNet-Peering zwischen den Zielzonen und den privaten Endpunkten zu verwenden. Verwenden von VNet-Injektion für Azure Databricks. Da es eine direkte Sichtverbindung zu allen Endpunkten gibt, gibt es keine Konnektivitätsprobleme.

Nächste Schritte

Der Erfassungsprozess mit Analysen auf Cloudebene in Azure