Azure Synapse サーバーレス SQL プールの機能とユース ケースを理解する
Azure Synapse Analytics は、大規模なデータの処理と分析に一般的に使用される幅広いテクノロジを組み合わせる統合分析サービスです。 データ ソリューションで最も普及しているテクノロジの 1 つは、データのクエリと操作のための業界標準言語である SQL です。
Azure Synapse Analytics のサーバーレス SQL プール
Azure Synapse SQL は、Azure Synapse Analytics の分散クエリ システムであり、次の 2 種類のランタイム環境を提供します。
- サーバーレス SQL プール: オンデマンド SQL クエリ処理。主にデータ レイク内のデータを操作するために使用されます。
- 専用 SQL プール: データがリレーショナル テーブルに格納されているデータ ウェアハウスをホストするために使用される、エンタープライズ規模のリレーショナル データベース インスタンスです。
このモジュールでは、サーバーレス SQL プールに焦点を当てます。これにより、データ レイク内のデータに対してクエリを実行するためのクエリごとの課金エンドポイントが提供されます。 サーバーレス SQL プールを使用する利点は次のとおりです。
- 特別なストアにデータをコピーしたり読み込んだりする必要なく、決まった場所でデータのクエリを実行できる、使い慣れた T-SQL 構文。
- 最も人気のあるドライバーを含めたさまざまなビジネス インテリジェンス、およびアドホック クエリ実行ツールを提供する統合接続。
- 大規模なデータと計算関数用に構築された分散クエリ処理による、高速なクエリ パフォーマンス。
- 組み込みのクエリ実行フォールト トレランスにより、大規模なデータ セットを対象とする実行時間の長いクエリの場合でも、高い信頼性と成功率を実現。
- セットアップするインフラストラクチャや保守するクラスターがない。 すべての Azure Synapse ワークスペース内にこのサービスの組み込みのエンドポイントが提供されるため、ワークスペースを作成したらすぐにデータのクエリ実行を開始できます。
- 予約されているリソースには課金されず、実行するクエリによって処理されるデータに対してのみが課金の対象。
サーバーレス SQL プールを使うタイミング
サーバーレス SQL プールは、データ レイク内に存在するデータへのクエリ実行用に調整されているため、管理上の負担がなくなるだけでなく、システムへのデータの取り込みについて心配する必要もなくなります。 既にレイク内にあるデータを対象にしたクエリを実行するだけです。
Synapse SQL サーバーレス リソース モデルは、Azure Synapse Analytics ワークスペースの Always-on サーバーレス SQL エンドポイントを使用して処理できる計画外または "バースト的な" ワークロードに最適です。 サーバー プールを使用すると、コストを監視して属性付けするために、実行された各クエリの正確なコストを把握する必要がある場合に便利です。
Note
サーバーレス SQL プールは分析システムであり、アプリケーションでトランザクション データの格納に使われるデータベースなどの OLTP ワークロードには推奨されません。 ミリ秒の応答時間を必要とし、データセット内の 1 つの行を特定する必要があるワークロードは、サーバーレス SQL プールには適していません。
サーバーレス SQL プールの一般的なユース ケースは次のとおりです。
- データ探索: データ探索では、データ レイクを参照してデータに関する初期の分析情報を得る必要がありますが、Azure Synapse Studio を使用すると簡単に実現できます。 リンクされたデータ レイク ストレージ内のファイルを参照し、組み込みのサーバーレス SQL プールを使用して SQL スクリプトを自動的に生成し、SQL Server のテーブルの場合と同様に、ファイルまたはフォルダーから上位 100 行を選択できます。 そこから、データが通常の SQL Server テーブル内にある場合と同様に、データに対してプロジェクション、フィルター処理、グループ化をはじめとするほとんどの操作を適用できます。
- データ変換: Azure Synapse Analytics には Synapse Spark を使用した優れたデータ変換機能がありますが、一部のデータエンジニアにとっては、SQL を使用したデータ変換の方がより簡単かもしれません。 サーバーレス SQL プールを使用すると、対話型または自動データ パイプラインの一部として、SQL ベースのデータ変換を実行できます。
- 論理データ ウェアハウス: データ レイク内のデータを最初に探索した後、サーバーレス SQL データベース内のテーブルやビューなどの外部オブジェクトを定義できます。 データはデータ レイク ファイルに格納されたままですが、クライアント アプリケーションや分析ツールが使用できるリレーショナル スキーマによって抽象化され、SQL Server でホストされているリレーショナル データベースと同様にデータにクエリを実行できます。