共用方式為


關於雲端規模分析的常見問題

以下是關於雲端規模分析的常見問題。

儲存體帳戶

為什麼我需要三個不同的儲存體帳戶? 我不能用一個每層 (原始、精簡和經篩選) 都有三個容器的儲存體帳戶就好嗎?

現今大部分資料分析模式都有三個層級,原始、經篩選和策劃。 雖然它們可保存在相同的儲存體中,但涉及到大規模實作時,就會造成角色型存取控制 (RBAC) 及存取控制清單 (ACL) 權限超過單一儲存體帳戶內允許數量的問題。 當您使用不同的儲存體帳戶時,便可以在大部分的實作中避免這個問題。

如需雲端規模分析,請參閱Azure Data Lake Storage概觀中討論其他原因。

Databricks

我們應該為每個產品部署 Azure Databricks 工作區嗎?

建議使用登陸區域內的共用產品 Azure Databricks 分析和資料科學工作區

做出此決策是為了降低資料平台作業小組的管理負擔。 Azure Databricks 有一套尚未整合到 Azure 原則中的獨立原則。 在大型環境中設定更多的 Azure Databricks 工作區,會造成更多的管理額外負荷。 例如,維護原則和支援的 Apache Hive 版本、更新 ADB 版本,以及強制執行外部 Apache Hive 中繼存放區。 中央平台小組無法在任何 Databricks 工作區中強制執行特定設定。 建議您在登陸區域中為產品小組設定共用工作區,讓資料平台作業小組可以在這裡定義必要的叢集原則和初始化指令碼。

建議您在登陸區域與私人端點之間使用 VNet 對等互連。 對於 Azure Databricks,請使用 VNet 插入。 由於所有端點皆為直接路徑,所以不會有連線問題。

後續步驟

在 Azure 中使用雲端規模分析內嵌程式