將數據倉儲遷移至 Azure Synapse Analytics 中的專用 SQL 集區
下列各節提供將現有數據倉儲解決方案遷移至 Azure Synapse Analytics 專用 SQL 集區(先前稱為 SQL 數據倉儲)所涉及的概觀。
概觀
開始移轉之前,您應該先確認 Azure Synapse Analytics 是工作負載的最佳解決方案。 Azure Synapse Analytics 是用於執行大型資料分析的分散式系統。 移轉至 Azure Synapse Analytics 需要一些不難瞭解但可能需要一些時間才能實作的設計變更。 但如果您的業務需要企業級的資料倉儲,它所帶來的優點將值得您投入時間和精力。 不過,如果您不需要 Azure Synapse Analytics 的強大功能,則使用 SQL Server 或 Azure SQL 資料庫 會更有成本效益。
在這些情況下,請考慮使用 Azure Synapse Analytics:
- 有一或多個 TB 的數據。
- 規劃對大量數據執行分析。
- 需要調整計算和記憶體的能力。
- 想要在不需要時暫停計算資源來節省成本。
相較於 Azure Synapse Analytics,請考慮其他選項來處理具有下列作業的在線事務處理 (OLTP) 工作負載:
- 高頻率讀取和寫入。
- 大量單一選取。
- 大量單一數據列插入。
- 逐列處理需求。
- 不相容的格式(例如 JSON 和 XML)。
移轉前
決定將現有的解決方案移轉至 Azure Synapse Analytics 之後,您必須先規劃移轉,再開始。 規劃的主要目標是確保您的數據、數據表架構和程式代碼與 Azure Synapse Analytics 相容。 目前系統與 Azure Synapse Analytics 之間有一些相容性差異,您必須加以解決。 此外,將大量數據遷移至 Azure 需要時間。 仔細規劃可加快將數據移至 Azure 的程式。
規劃的另一個主要目標是調整您的設計,以確保您的解決方案充分利用 Azure Synapse Analytics 設計來提供的高查詢效能。 根據規模設計資料倉儲引進了獨特的設計模式,因此傳統方法並不一定是最佳方法。 雖然移轉之後可以進行一些設計調整,但稍早進行變更會讓您稍後節省時間。
移轉
執行成功的移轉需要您移轉數據表架構、程式代碼和數據。 如需這些主題的詳細指引,請參閱下列文章:
更多資源
如需從 Netezza 或 Teradata 移轉至 Azure Synapse Analytics 的詳細資訊,請從移轉七篇文章序列的第一個步驟開始:
從真實世界參與的移轉資產
如需獲得更多協助來完成此遷移,請參閱下列資源。 這些都是為了支援實際遷移專案活動而開發。
標題/連結 | 描述 |
---|---|
資料工作負載評量模型及工具 | 此工具為指定的工作負載,提供建議的「最適合」目標平台、雲端整備,以及應用程式或資料庫補救等級。 提供自動化和統一的目標平台決策程序,簡單按一下就能計算和報告,有助於加快評估大型資產。 |
將數據載入 Azure Synapse Analytics 時處理數據編碼問題 | 此部落格文章提供您在使用PolyBase將數據載入專用SQL集區時可能會遇到的一些數據編碼問題深入解析(先前稱為SQL數據倉儲)。 本文也提供一些選項,可讓您用來克服這類問題並成功載入數據。 |
在 Azure Synapse Analytics 專用 SQL 集區中取得數據表大小 | 架構設計人員必須執行的主要工作之一是取得移轉後新環境的計量。 範例包括從內部部署到雲端收集載入時間,以及收集PolyBase載入時間。 其中一項最重要的工作是判斷與客戶目前平臺相比,專用SQL集區(先前稱為 SQL 數據倉儲)中的記憶體大小。 |
資料 SQL 工程小組開發這些資源。 此小組的核心任務是為資料平台遷移專案的複雜現代化排除障礙,加速遷移至 Microsoft 的 Azure 資料平台。
影片
觀看 Walgreens 如何使用 大約 100 TB 的數據從 Netezza 遷移至 Azure Synapse Analytics 的零售庫存系統 。
提示
如需 Synapse 移轉的詳細資訊,請參閱 Azure Synapse Analytics 移轉指南。