次の方法で共有


SQL ウェアハウスの種類

Databricks SQL では、サーバーレス、プロ、クラシックの種類がサポートされています。 この記事では、各種類で使用できる機能の概要を説明し、パフォーマンスと機能を比較します。

種類別のパフォーマンス機能

SQL ウェアハウスの種類ごとに異なるパフォーマンス機能があります。 次の table は、各 SQL ウェアハウスの種類でサポートされるパフォーマンス機能を示しています。

倉庫の種類 フォトンエンジン 予測 IO インテリジェント ワークロード管理
サーバーレス X X X
長所 X X
クラシック X

次の list では、各パフォーマンス機能について説明します。

  • Photon: Databricks の組み込みのベクター化クエリ エンジン。 これにより、既存の SQL と DataFrame API の呼び出しが高速化され、ワークロードあたりの総コストが削減されます。

  • 予測 IO: SQL クエリでの選択的スキャン操作を高速化するための一連の機能。 予測 IO は、さまざまな高速化を提供できます。

  • インテリジェント ワークロード管理 (IWM): Databricks SQL Serverless が多数のクエリを迅速かつコスト効率よく処理する機能を強化する機能の set です。 IWM では、AI を利用した予測と動的管理の手法を使用して、ワークロードに適切な量のリソースが迅速に存在することを確認します。 主な違いは、静的しきい値を使用するのではなく、ワークロードの需要に動的に対応する Databricks SQL の AI 機能にあります。

    手記

    各倉庫の種類の価格と詳細な機能の比較については、Databricks SQLを参照してください。 最新の Databricks SQL 機能については、Databricks SQL リリース ノート参照してください。

SQL ウェアハウスの種類のパフォーマンスの違い

SQL ウェアハウスの種類ごとにパフォーマンス特性が異なります。

サーバーレス SQL ウェアハウス

Azure Databricks サーバーレス アーキテクチャを使用すると、サーバーレス SQL ウェアハウスは Databricks SQL のすべてのパフォーマンス機能をサポートします。 サーバーレス SQL ウェアハウスとそのパフォーマンス機能により、次のことを実現できます:

  • 迅速な起動時間 (通常は 2 ~ 6 秒)。
  • 待機時間を短く維持するために必要な場合に、より多くのコンピューティングを取得するための迅速なアップスケール。
  • クエリの許可は、仮想マシンよりもハードウェアの制限に近くなります。
  • 需要が低い場合にコストを最小限に抑える迅速なスケールダウンにより、最適化されたコストとリソースで一貫したパフォーマンスを実現します。

最適なスタートアップ パフォーマンス、最も効率的な IO、時間の経過と共に大きく変化するクエリ要求のスマートな処理、およびクエリ キューが発生した場合の迅速な自動スケーリングのために、サーバーレス SQL ウェアハウスを選択します。 サーバーレス自動スケールとクエリ キューのを参照してください。

サーバーレス SQL ウェアハウスは、次の種類のワークロードで優れたパフォーマンスを発揮します。

  • ETL
  • ビジネス インテリジェンス
  • 調査分析

重要

SQL ウェアハウスでは、資格情報パススルーをサポートしていません。 Databricks では、データ ガバナンスに Unity Catalog を使用することをお勧めします。 Unity Catalogとは何ですか?を参照してください。

Pro SQL ウェアハウス

プロの SQL ウェアハウスでは Photon と予測 IO がサポートされていますが、インテリジェント ワークロード管理はサポートされていません。 (サーバーレス SQL ウェアハウスとは異なり) プロ SQL ウェアハウスでは、コンピューティング レイヤーは Azure Databricks アカウントではなく、Azure サブスクリプション アカウントに存在します。 インテリジェント ワークロード管理がないと、ウェアハウスは時間の経過と同時に大きく変化し、サーバーレス SQL ウェアハウスほど迅速に自動スケーリングできないクエリの需要に対する応答性が低下します。 プロ SQL ウェアハウスの起動には数分 (通常は約 4 分) かかり、サーバーレス SQL ウェアハウスよりも応答性が低い状態でスケールアップとスケールダウンが行われます。 プロおよびクラシック SQL ウェアハウスのキューイングと自動スケーリングについては、のページを参照してください。

次の場合は、プロの SQL ウェアハウスを使用します。

  • サーバーレス SQL ウェアハウスは、リージョンでは使用できません。
  • カスタム定義のネットワークがあり、フェデレーションまたはハイブリッド型アーキテクチャのために、クラウドまたはオンプレミスのネットワーク内のデータベースに接続する必要があります。 たとえば、イベント バスやデータベースなどの他のサービスをネットワークに配置する場合や、ネットワークをオンプレミス ネットワークに接続する場合は、プロ SQL ウェアハウスを使用します。

クラシック SQL ウェアハウス

従来の SQL ウェアハウスは Photon をサポートしますが、予測 IO またはインテリジェント ワークロード管理はサポートしていません。 (サーバーレス SQL ウェアハウスとは異なり) 従来の SQL ウェアハウスでは、コンピューティング レイヤーは Azure Databricks アカウントではなく Azure サブスクリプション アカウントに存在します。 予測 IO またはインテリジェント ワークロード管理をサポートしないクラシック SQL ウェアハウスでは、エントリ レベルのパフォーマンスのみが提供され、サーバーレスまたはプロの SQL ウェアハウスよりもパフォーマンスが低下します。 また、従来の SQL ウェアハウスの起動には数分 (通常は約 4 分) かかり、サーバーレス SQL ウェアハウスよりも応答性が低い状態でスケールアップとスケールダウンが行われます。 プロおよびクラシック SQL ウェアハウスのキューと自動スケーリングに関するページを参照してください。

従来の SQL ウェアハウスを使用して、エントリ レベルのパフォーマンスと Databricks SQL 機能を使用してデータ探索用の対話型クエリを実行します。

手記

SQL ウェアハウスのサイズ設定と、クエリ キューに応じてスケーリングする方法については、「プロおよびクラシック SQL ウェアハウスのキューと自動スケールの」を参照してください。

倉庫タイプの既定値は何ですか?

サーバーレス SQL ウェアハウスをサポートし、要件を満たす リージョン内のワークスペースの場合:

  • UI を使用すると、既定の SQL ウェアハウスの種類はサーバーレスです。
  • 既定の parametersを使用して SQL ウェアハウス API を利用する場合、既定の SQL ウェアハウスのタイプはクラシックです。 サーバーレスを使用するには、enable_serverless_compute パラメーターを true に、warehouse_typepro にsetします。 このワークスペースで SQL warehouses API を使用して 2022 年 11 月 1 日から 2023 年 5 月 19 日までの間にウェアハウスを作成し、サーバーレス SQL ウェアハウスの要件に適合する場合、既定値は trueに set。 特に多くのワークスペースを持つ組織では、あいまいさを回避するために、Databricks では常にこのフィールドを設定することをお勧めします。
  • ワークスペースで従来の外部 Hive メタストアを使用している場合、サーバーレス SQL ウェアハウスはサポートされません。 既定の SQL ウェアハウスの種類は、サーバーレス コンピューティングが無効になっている場合と同じで、UI ではプロ、API ではクラシックです。 また、Unity Catalog またはその他のオプションの詳細については、Azure Databricks アカウント チームにお問い合わせください。

サーバーレス SQL ウェアハウスをサポートしていないワークスペースの場合:

  • UI を使用すると、既定の SQL ウェアハウスの種類は pro です。
  • 既定の parametersと既定の SQL warehouses API を使用すると、SQL ウェアハウスのタイプはクラシックです。