共用方式為


適用於 Apache Spark 的 SQL Server 巨量資料叢集執行階段指南

適用於:SQL Server 2019 (15.x)

重要

Microsoft SQL Server 2019 巨量資料叢集附加元件將會淘汰。 SQL Server 2019 巨量資料叢集的支援將於 2025 年 2 月 28 日結束。 平台上將完全支援含軟體保證 SQL Server 2019 的所有現有使用者,而且軟體將會持續透過 SQL Server 累積更新來維護,直到該時間為止。 如需詳細資訊,請參閱公告部落格文章Microsoft SQL Server 平台上的巨量資料選項

推出適用於 Apache Spark 的 SQL Server 巨量資料叢集執行階段

適用於 Apache Spark 的 SQL Server 巨量資料叢集執行階段是針對 Apache Spark 標準化的規格,可讓發行版本之間能夠順暢地互通。 此 Spark 執行階段是由程式碼語言發行版本、引擎最佳化、核心程式庫和封裝組成之一致且已建立版本的區塊。

使用此執行階段規格的每個產品都會包含相同版本的 Apache Spark Core、PySpark、Scala Spark、Spark.R、sparklyr 和 .NET for Spark。

所有的分散式封裝和程式庫也都會相同。 此規格的其中一個主要目標,是藉由提供持續策劃和更新的現成封裝和連線清單,為資料工程師和資料科學家提供一流的體驗。

適用於 Apache Spark 的 SQL Server 巨量資料叢集執行階段優點:

  1. 可供所有產品和服務使用的 Spark 引擎最佳化和功能
  2. 已確立的發行頻率
  3. Spark 產品和服務之間的順暢互通性
  4. 專為資料工程師和資料科學家策劃的封裝
  5. 一致的封裝管理案例

發行頻率和命名標準

適用於 Apache Spark 的 SQL Server 巨量資料叢集執行階段規格定義如下:

執行階段命名標準如下所示:

"PRODUCT_NAME.SPARK_MAJOR_VERSION.CALENDAR_YEAR.RELEASE#"

範例為 "BDC.3.2021.1"。

RELEASE# 是連續語意編號。 未繫結至月份或任何其他標準。 一旦建立執行階段版本,即不可變。 每個 SQL Server 巨量資料叢集版本都會隨附一個執行階段版本。

目前的執行階段版本中有哪些內容?

SQL Server 巨量資料叢集平台版本資訊包含版本的執行階段名稱和完整內容。

下一步

如需詳細資訊,請參閱 SQL Server 巨量資料叢集簡介