Apache Spark 向け SQL Server ビッグ データ クラスター ランタイムに関するガイド
適用対象: SQL Server 2019 (15.x)
重要
Microsoft SQL Server 2019 ビッグ データ クラスターのアドオンは廃止されます。 SQL Server 2019 ビッグ データ クラスターのサポートは、2025 年 2 月 28 日に終了します。 ソフトウェア アシュアランス付きの SQL Server 2019 を使用する既存の全ユーザーはプラットフォームで完全にサポートされ、ソフトウェアはその時点まで SQL Server の累積更新プログラムによって引き続きメンテナンスされます。 詳細については、お知らせのブログ記事と「Microsoft SQL Server プラットフォームのビッグ データ オプション」を参照してください。
Apache Spark 向け SQL Server ビッグ データ クラスター ランタイムの概要
Apache Spark 向け SQL Server ビッグ データ クラスター ランタイムは、配布間のシームレスな相互運用性を実現できるようにするための、Apache Spark の標準化された仕様です。 この Spark ランタイムは、プログラミング言語の配布、エンジンの最適化、コア ライブラリ、パッケージに関する一貫性のあるバージョン管理されたブロックです。
このランタイム仕様を使用するすべての製品には、同じバージョンの Apache Spark Core、PySpark、Scala Spark、Spark.R、sparklyr、.NET for Spark が含められます。
配布されるパッケージおよびライブラリもすべて同じです。 この仕様の主な目標の 1 つは、常にキュレーションおよび更新された、パッケージとコネクタの一覧を標準で提供することで、データ エンジニアとデータ科学者に最上級のエクスペリエンスを提供することです。
Apache Spark 向け SQL Server ビッグ データ クラスター ランタイムのベネフィットは次のとおりです。
- すべての製品とサービスで使用できる Spark エンジンの最適化と機能
- 確立されたリリースの頻度
- Spark 製品とサービス間のシームレスな相互運用性
- データ エンジニアとデータ科学者向けのキュレーションされたパッケージ
- 一貫したパッケージ管理の順序
リリースの頻度と名前付けの標準
Apache Spark 向け SQL Server ビッグ データ クラスター ランタイム仕様では、次の内容を定義します。
ランタイムの名前付け標準は、次のようになります。
"PRODUCT_NAME.SPARK_MAJOR_VERSION.CALENDAR_YEAR.RELEASE# "
たとえば、"BDC.3.2021.1" となります。
RELEASE# は、連続したセマンティック番号です。 これは、月または他の標準に結び付けられるものではありません。 ランタイム リリースはひとたび作成されると、変更できません。 SQL Server ビッグ データ クラスターの各リリースには、1 つのバージョンのランタイムが付属します。
現在のランタイム リリースには何が含まれていますか?
SQL Server ビッグ データ クラスターのプラットフォーム リリース ノートには、ランタイム名とリリースの完全な内容が含まれています。
次のステップ
詳細については、「SQL Server ビッグ データ クラスターの概要」を参照してください。