Azure Synapse サーバーレス SQL プールの機能とユース ケースについて
Azure Synapse Analytics は、データを大規模に処理および分析するために一般的に使用されるさまざまなテクノロジを組み合わせる統合分析サービスです。 データ ソリューションで最も一般的なテクノロジの 1 つは SQL です。SQL は、データのクエリと操作を行う業界標準の言語です。
Azure Synapse Analytics のサーバーレス SQL プール
Azure Synapse SQL は、次の 2 種類のランタイム環境を提供する Azure Synapse Analytics の分散クエリ システムです。
- サーバーレス SQL プール: オンデマンド SQL クエリ処理。主にデータ レイク内のデータを操作するために使用されます。
- 専用 SQL プール: リレーショナル テーブルにデータが格納されているデータ ウェアハウスをホストするために使用されるエンタープライズ規模のリレーショナル データベース インスタンス。
このモジュールでは、データ レイク内のデータに対してクエリを実行するためのクエリごとの支払いエンドポイントを提供するサーバーレス SQL プールに焦点を当てます。 サーバーレス SQL プールを使用する利点は次のとおりです。
- 特殊なストアにデータをコピーまたは読み込む必要なく、データをインプレースでクエリするための使い慣れた Transact-SQL 構文。
- 最も一般的なドライバーを含む、幅広いビジネス インテリジェンスおよびアドホック クエリ ツールからの統合された接続。
- 大規模なデータと計算関数用に構築された分散クエリ処理により、高速なクエリ パフォーマンスが得られます。
- クエリ実行のフォールト トレランスが組み込まれているため、大規模なデータ セットを含む実行時間の長いクエリでも高い信頼性と成功率が得られます。
- セットアップするインフラストラクチャや、維持するクラスターはありません。 このサービスの組み込みエンドポイントはすべての Azure Synapse ワークスペース内に提供されるため、ワークスペースが作成されたらすぐにデータのクエリを開始できます。
- 予約済みのリソースに対しては課金されません。実行するクエリによって処理されるデータに対してのみ課金されます。
サーバーレス SQL プールを使用する場合
サーバーレス SQL プールは、データ レイクに存在するデータに対してクエリを実行できるように調整されているため、管理上の負担をなくすことに加えて、システムへのデータの取り込みを心配する必要がなくなります。 クエリは、既にレイクにあるデータをポイントして実行するだけです。
Synapse SQL サーバーレス リソース モデルは、Azure Synapse Analytics ワークスペースで常時接続サーバーレス SQL エンドポイントを使用して処理できる、計画外または "バースト" なワークロードに最適です。 サーバーレス プールを使用すると、コストを監視および属性化するために実行される各クエリの正確なコストを把握する必要がある場合に役立ちます。
注
サーバーレス SQL プールは分析システムであり、トランザクション データを格納するためにアプリケーションで使用されるデータベースなどの OLTP ワークロードには推奨されません。 ミリ秒の応答時間を必要とし、データ セット内の 1 つの行を特定しようとしているワークロードは、サーバーレス SQL プールには適していません。
サーバーレス SQL プールの一般的なユース ケースは次のとおりです。
- データ探索: データ探索では、データ レイクを参照してデータに関する初期分析情報を取得する必要があり、Azure Synapse Studio を使用して簡単に実現できます。 リンクされた Data Lake Storage 内のファイルを参照し、組み込みのサーバーレス SQL プールを使用して、SQL スクリプトを自動的に生成して、SQL Server のテーブルと同様に、ファイルまたはフォルダーから TOP 100 行を選択できます。 そこから、データが通常の SQL Server テーブルにあるかのように、プロジェクション、フィルター処理、グループ化、およびほとんどの操作をデータに適用できます。
- データ変換: Azure Synapse Analytics は Synapse Spark で優れたデータ変換機能を提供しますが、一部のデータ エンジニアは SQL を使用してデータ変換を実現する方が簡単です。 サーバーレス SQL プールを使用すると、SQL ベースのデータ変換を実行できます。対話形式または自動データ パイプラインの一部として使用できます。
- 論理データ ウェアハウスの: データ レイク内のデータを最初に探索した後、サーバーレス SQL データベース内のテーブルやビューなどの外部オブジェクトを定義できます。 データはデータ レイク ファイルに格納されたままですが、リレーショナル スキーマによって抽象化されます。リレーショナル スキーマは、クライアント アプリケーションと分析ツールが SQL Server でホストされているリレーショナル データベースと同様にデータを照会するために使用できます。