列ストアインデックス - 設計ガイダンス

[アーティクル]
2025-02-28

適用対象:SQL Server Azure SQL Database Azure SQL Managed Instance Azure Synapse Analytics Analytics Platform System (PDW)Microsoft Fabric SQL Database

列ストアインデックスの設計に関する高レベルの推奨事項です。設計に関していくつかの適切な意思決定を行うと、列ストアインデックスの設計が意図する、高いデータ圧縮率とクエリパフォーマンスを実現できます。

前提条件

この記事では、列ストアのアーキテクチャと用語に精通していることを想定しています。詳細については、「 Columnstore indexes: Overview and Columnstore Index Architectureを参照してください。

データ要件を認識する

列ストアインデックスを設計する前に、データ要件について可能な限り理解してください。たとえば、次の質問に対する答えを考えてみてください。

テーブルの大きさはどれくらいか。
自分のクエリは主に広範囲の値をスキャンする分析を実行するか。列ストアインデックスは、特定の値の検索ではなく、広範囲のスキャンに対してうまく機能するように設計されています。
自分のワークロードは多数の更新と削除を実行するか。列ストアインデックスは、データが安定しているときにうまく機能します。クエリが更新および削除するのは行の 10% 未満である必要があります。
私にはデータウェアハウスのファクトテーブルとディメンションテーブルがありますか？
トランザクションワークロードの分析を実行する必要があるか。そうである場合は、リアルタイム運用分析について列ストアの設計ガイダンスをご覧ください。

列ストアインデックスは必要でない場合があります。ヒープまたはクラスター化インデックスを持つ行ストア (または B ツリー) テーブルは、データをシークするクエリ、特定の値の検索、狭い範囲の値でのクエリを実行するときに最適なパフォーマンスを発揮します。トランザクションワークロードでは、広範囲のテーブルスキャンではなく主にテーブルシークを必要とする傾向があるため、行ストアインデックスを使用してください。

ニーズに最適な列ストアインデックスを選ぶ

列ストアインデックスには、クラスタ化されたものと非クラスタ化されたものがあります。クラスター化列ストアインデックスでは、1 つ以上の非クラスター化 B ツリーインデックスを使用できます。列ストアインデックスは、簡単に試すことができます。テーブルを列ストアインデックスとして作成する場合は、列ストアインデックスを削除して、テーブルを行ストアテーブルに簡単に変換できます。

オプションと推奨事項の概要を次に示します。

列ストアオプション	使用する場合に関する推奨事項	圧縮
クラスター化列ストアインデックス	用途: 従来のデータウェアハウスワークロード（スタースキーマまたはスノーフレークスキーマを使用） 2) 大量のデータを挿入し、更新と削除は最小限であるモノのインターネット (IOT)。	平均 10 倍
順序付き列ストアインデックス	単一の順序付けられた述語列または列セットを使用して、クラスター化列ストアインデックスをクエリする場合に使用します。このガイダンスは、行ストアクラスター化インデックスのキー列を選択するのと似ていますが、圧縮された基になる行グループの動作は異なります。詳細については、「CREATE COLUMNSTORE INDEX」と「順序付けられた列ストアインデックスを使用したパフォーマンスチューニング」を参照してください。	平均 10 倍
クラスター化列ストアインデックスの非クラスター化 B ツリーインデックス	以下の操作を実行するために使用します。 1) クラスター化列ストアインデックスに主キーと外部キーの制約を適用します。 2) 特定の値または小さい範囲の値を検索するクエリを高速化します。 3) 特定の行の更新と削除を高速化します。	平均 10 倍に加えて、NCI 用の追加ストレージ。
ディスクベースのヒープまたは B ツリーインデックスの非クラスター化列ストアインデックス	用途: 1) いくつかの分析クエリがある OLTP ワークロード。分析用に作成された B ツリーインデックスを削除し、1 つの非クラスター化列ストアインデックスで置き換えることができます。 2) 抽出、変換、および読み込み (ETL) 操作を実行してデータを別のデータウェアハウスに移動する多くの従来の OLTP ワークロード。一部の OLTP テーブルに非クラスター化列ストアインデックスを作成すると、ETL と個別のデータウェアハウスを除外できます。	NCCI は、平均で 10% 以上のストレージを必要とする追加のインデックスです。
メモリ内テーブルの列ストアインデックス	ベーステーブルがメモリ内テーブルであることを除いて、ディスクベーステーブルの非クラスター化列ストアインデックスと同じ推奨事項。	列ストアインデックスは追加のインデックスです。

データウェアハウスの大規模テーブルにはクラスター化列ストアインデックスを使用する。

クラスター化列ストアインデックスは複数のインデックスであり、主テーブルストレージです。大規模なデータウェアハウスのファクトテーブルとディメンションテーブルに対する高いデータ圧縮率とクエリパフォーマンスの大幅な向上を実現します。クラスター化列ストアインデックスは、トランザクションクエリよりも分析クエリに最適です。分析クエリは、特定の値の検索よりも、広範囲の値に対して操作を実行する傾向があるためです。

次の場合は、クラスター化列ストアインデックスの使用を検討してください。

各パーティションには少なくとも100万行があります。列ストアインデックスでは、各パーティション内に行グループがあります。テーブルが小さすぎて各パーティション内の行グループを満たさない場合は、列ストアの圧縮とクエリのパフォーマンスの利点が得られない可能性があります。
クエリが主に値の範囲に対する分析を実行する場合。たとえば、列の平均値を検索するには、クエリですべての列値をスキャンする必要があります。次に、値を加算して集計し、平均値を判断します。
挿入のほとんどは、大量のデータに対して行われ、更新と削除は最小限です。モノのインターネット (IoT) などの多くのワークロードは大量のデータを挿入し、更新と削除は最小限です。これらのワークロードは、クラスター化列ストアインデックスを使用する場合の圧縮とクエリパフォーマンスのメリットを利用できます。

次の場合はクラスター化列ストアインデックスを使用しないでください。

テーブルに、varchar(max)、nvarchar(max)、varbinary(max) データ型が必要な場合。または、これらの列を含まないように列ストアインデックスを設計します (適用対象: SQL Server 2016 (13.x) 以前のバージョン)。
テーブルデータは永続的ではありません。データをすばやく格納および削除する必要がある場合は、ヒープまたは一時テーブルの使用を検討してください。
テーブルの行数がパーティションあたり 100 万未満の場合。
更新と削除がテーブルに対する操作の 10% を超える場合。大量の更新と削除は断片化の原因となります。断片化は、再構成と呼ばれる操作を実行するまでの圧縮率とクエリのパフォーマンスに影響します。これにより、すべてのデータが列ストアに強制的に挿入され、断片化が解消されます。詳しくは、列ストアインデックスでインデックスの断片化を最小限に抑える方法に関する記事をご覧ください。

詳細については、データウェアハウスの Columnstore インデックスを参照してください。

大規模なデータウェアハウステーブルに対して順序付き列ストアインデックスを使用する

順序付けされた列ストアインデックスの可用性については、「列ストアインデックスの : 概要」を参照してください。

次のシナリオでは、順序付き列ストアインデックスの使用を検討してください。

データが比較的静的で (頻繁に書き込みと削除が行われず)、順序付き列ストアインデックスキーが静的な場合、順序付き列ストアインデックスは、非順序列ストアインデックスまたは分析ワークロードの行ストアインデックスよりもパフォーマンス上の大きな利点を提供できます。
順序付けられた列ストアインデックスキーの最初の列の値が異なるほど、パフォーマンスが向上する可能性があります。これは、文字列データのセグメントの削除が改善されたためです。詳細については、「セグメントの削除」を参照してください。
頻繁にクエリを実行し、セグメントの削除 (特にキーの最初の列) の利点を得ることができる順序付き列ストアインデックスキーを選択します。テーブル内の他の列でのセグメントの削除によるパフォーマンスの向上は、予測不可能です。
最新の分析データのみを照会する必要があるユースケース (たとえば、過去 15 秒の順序付き列ストアインデックスなど) は、古いデータのセグメント除去を提供できます。順序付けられた列ストアデータのキーの最初の列は、挿入日や作成日などの日付/時刻データである必要があります。セグメントの削除は、順序付けされていない列ストアインデックスよりも順序付け列ストアインデックスの方が効果的です。
GUID データと一緒にキーを含むテーブルの順序付き列ストアインデックスを検討します。ここで、uniqueidentifier データ型をセグメントの削除に使用できるようになりました。

順序付き列ストアインデックスは、次のシナリオでは効果的ではない可能性があります。

他の列ストアインデックスと同様に、挿入アクティビティのレートが高いと、過剰なストレージ I/O が発生する可能性があります。
書き込み操作が多いワークロードでは、タプルムーバーによる行グループのメンテナンスにより、セグメント削除の品質が時間の経過につれて低下します。これは、ALTER INDEX REORGANIZEを使用した列ストアインデックスの定期的なメンテナンスによって軽減できます。

Bツリー非クラスター化インデックスを追加して、テーブル検索の効率を向上させる

SQL Server 2016 (13.x) 以降では、クラスター化列ストアインデックスのセカンダリインデックスとして非クラスター化 B ツリーインデックスまたは行ストアインデックスを作成できます。列ストアインデックスが変更されると、非クラスター化 B ツリーインデックスが更新されます。これは、うまく利用するとメリットのある強力な機能です。

セカンダリ B ツリーインデックスを使用すると、すべての行をスキャンせずに特定の行を効率的に検索できます。他のオプションも使用できます。たとえば、B ツリーインデックスで UNIQUE 制約を使用して、主キーまたは外部キー制約を適用できます。一意でない値は B ツリーインデックスへの挿入に失敗するため、SQL Server では列ストアに値を挿入できません。

列ストアインデックスの B ツリーインデックスは次の目的で使用することを検討してください。

特定の値または小さい範囲の値を検索するクエリを実行する。
主キー制約や外部キー制約などの制約を適用する。
更新や削除の操作を効率的に実行する。 B ツリーインデックスは、テーブルまたはテーブルのパーティション全体をスキャンせずに、更新や削除のために特定の行をすばやく検索できます。
B ツリーインデックスの格納に使用可能な追加の記憶域がある。

非クラスター化カラムストアインデックスを使用してリアルタイムで分析を行う

SQL Server 2016 (13.x) 以降では、行ストアディスクベーステーブルまたはインメモリ OLTP テーブルで非クラスター化列ストアインデックスを使用できます。これにより、トランザクションテーブルに対して分析をリアルタイムで実行できるようになります。トランザクションは基になるテーブルで発生しますが、列ストアインデックスに対して分析を実行できます。 1 つのテーブルで両方のインデックスを管理するため、行ストアと列ストア両方のインデックスに対して変更をリアルタイムで使用できます。

列ストアインデックスは行ストアインデックスよりもデータ圧縮率が 10 倍高いため、必要な追加ストレージがわずかで済みます。たとえば、圧縮された行ストアテーブルが 20 GB を必要とする場合、列ストアインデックスではさらに 2 GB 必要な場合があります。必要な追加領域は、非クラスター化列ストアインデックス内の列数によっても異なります。

次の場合は、非クラスター化列ストアインデックスの使用を検討してください。

トランザクション行ストアテーブルでリアルタイムに分析を実行する。分析用に設計された既存の B ツリーインデックスを非クラスター化列ストアインデックスで置き換えることができます。
別個のデータウェアハウスの必要性を排除する。従来、企業では行ストアテーブルでトランザクションを実行し、データを別のデータウェアハウスに読み込んで分析を実行しています。多くのワークロードでは、トランザクションテーブルに非クラスター化列ストアインデックスを作成して、読み込みプロセスと別のデータウェアハウスを排除できます。

SQL Server 2016 (13.x) には、このシナリオのパフォーマンスを高めるいくつかの方法が用意されています。 OLTP アプリケーションに変更を加えないで非クラスター化列ストアインデックスを有効にできるため、簡単に試すことができます。

処理リソースを追加するには、読み取り可能なセカンダリに対して分析を実行できます。読み取り可能なセカンダリを使用すると、トランザクションのワークロードと分析ワークロードの処理が分離されます。

詳細については、「リアルタイム運用分析のための列ストアの使用を開始する」を参照してください。

最適な列ストアインデックスの選択について詳しくは、Sunil Agarwal のブログで「Which columnstore index is right for my workload?」(自分のワークロードに適した列ストアインデックス) をご覧ください。

テーブルのパーティションを使用してデータ管理とクエリのパフォーマンスを高める

列ストアインデックスでは、データの管理とアーカイブの優れた方法であるパーティション分割がサポートされます。パーティション分割では、操作を 1 つ以上のパーティションに制限することでクエリのパフォーマンスも向上します。

パーティションを使用してデータを管理しやすくする

大規模なテーブルの場合、データの範囲を管理する唯一の現実的な方法は、パーティションの使用です。行ストアテーブルのパーティションの利点は、列ストアインデックスにも適用されます。

たとえば、行ストアと列ストアの両方のテーブルは、次の目的でパーティションを使用します。

増分バックアップのサイズを制御する。パーティションをバックアップしてファイルグループを分離し、読み取り専用としてマークできます。これにより、将来のバックアップでは読み取り専用のファイルグループがスキップされます。
古いパーティションを低コストのストレージに移動してストレージコストを節約する。たとえば、パーティションの切り替えを使用して、パーティションを低コストの記憶域の場所に移動できます。
パーティションに対する操作を制限して操作を効率的に実行する。たとえば、インデックスのメンテナンスのために、断片化されたパーティションのみを対象とすることができます。

さらに、列ストアインデックスでは、パーティション分割を次の目的で使用します。

ストレージコストをさらに 30% を節約する。 COLUMNSTORE_ARCHIVE圧縮オプションを使用して、古いパーティションを圧縮できます。クエリのパフォーマンスが低下する可能性があり、パーティションのクエリが頻繁でない場合は許容される可能性があります。

パーティションを使用してクエリのパフォーマンスを向上させる

パーティションを使用して、スキャンするクエリを特定のパーティションのみに制限して、スキャンする行数を制限できます。たとえば、インデックスが年でパーティション分割され、クエリが昨年のデータを分析する場合、スキャンする必要があるのは 1 つのパーティション内のデータだけです。

列ストアインデックスに使用するパーティションを少なくする

データサイズが十分に大きくない限り、列ストアインデックスは、行ストアインデックスに使用するよりも少ないパーティションで最高のパフォーマンスを発揮します。パーティションごとに少なくとも 100 万行がない場合、ほとんどの行がデルタストアに入る可能性があり、その場合、列ストア圧縮の性能向上の恩恵を受けることができません。たとえば、10 個のパーティションがあるテーブルに 100 万行を読み込み、各パーティションが 100,000 行を受け取ると、すべての行がデルタ行グループに移動します。

例:

1,000,000 行を 1 つのパーティションまたは非パーティションテーブルに読み込みます。 1,000,000 行を含む 1 つの圧縮行グループを取得します。これは、高いデータ圧縮と高速なクエリパフォーマンスに優れています。
1,000,000 行を 10 個のパーティションに均等に読み込みます。各パーティションは、列ストア圧縮の最小しきい値未満である 100,000 行を受け取ります。その結果、列ストアインデックスには、それぞれ 100,000 行を含む 10 個のデルタ行グループがある可能性があります。デルタ行グループを列ストアに強制的に移動する方法があります。ただし、これらが列ストアインデックス内の唯一の行である場合、圧縮された行グループは小さすぎて、最適な圧縮とクエリパフォーマンスを実現できません。

パーティション分割について詳しくは、Sunil Agarwal のブログ記事「Should I partition my columnstore index?」(自分の列ストアインデックスは分割する必要があるか) をご覧ください。

適切なデータの圧縮方法を選ぶ

列ストアインデックスは、データ圧縮に関する 2 つの選択肢 (列ストア圧縮とアーカイブ圧縮) を提供しています。圧縮オプションは、インデックスの作成時、または後で ALTER INDEX ... REBUILD を使用して変更するときに選択できます。

列ストア圧縮を使用して最適なクエリパフォーマンスを実現する

列ストア圧縮は通常、行ストアインデックスよりも 10 倍高い圧縮率を実現します。これは列ストアインデックスの標準的な圧縮方法で、高速なクエリパフォーマンスを実現します。

アーカイブ圧縮を使用して最適なデータ圧縮を実現する

アーカイブ圧縮は、クエリのパフォーマンスが重要ではないときに、圧縮率を最大化するように設計されています。列ストア圧縮よりも高いデータ圧縮率を実現しますが、価格は高くなります。データの圧縮と圧縮解除に時間がかかるため、高速なクエリパフォーマンスには適していません。

行ストアテーブルを列ストアインデックスに変換するときに最適化を使用する

データが行ストアテーブルに既に存在する場合は、CREATE COLUMNSTORE INDEX を使用して、テーブルをクラスター化列ストアインデックスに変換できます。次のように、テーブルが変換された後にクエリのパフォーマンスを改善するいくつかの最適化があります。

MAXDOP を使用して行グループの品質を向上させる

ヒープまたはクラスター化 B ツリーインデックスを列ストアインデックスに変換するプロセッサの最大数を構成できます。プロセッサを構成するには、最大並列度オプション (MAXDOP) を使用します。

大量のデータがある場合、MAXDOP 1 が遅すぎる可能性があります。 MAXDOP を 4 に増やすとうまく動作します。この結果、最適な行数を持たない、いくつかの行グループが生成される場合は、ALTER INDEX REORGANIZE を実行してそれらをバックグラウンドでマージできます。

B ツリーインデックスの並べ替え順序を保持する

B ツリーインデックスは並べ替えられた順序で行を既に格納しているため、行を列ストアインデックスに圧縮するときにその順序を維持すると、クエリのパフォーマンスが向上することがあります。

列ストアインデックスは、データを並べ替えませんが、メタデータを使用して、各行グループ内の各列セグメントの最小値と最大値を追跡します。値の範囲をスキャンする場合、行グループをスキップするときに簡単に計算できます。データが並べ替えられていると、より多くの行グループをスキップできます。

変換中に並べ替え順序を維持するには:

DROP_EXISTING 句を指定した CREATE COLUMNSTORE INDEX を使用します。これにより、インデックスの名前も保持されます。行ストアインデックスの名前を既に使用しているスクリプトがある場合は、更新する必要はありません。

次の例では、MyFactTable という名前のテーブル上のクラスター化された行ストアインデックスをクラスター化列ストアインデックスに変換します。インデックス名 ClusteredIndex_d473567f7ea04d7aafcac5364c241e09 は同じままになります。
```
CREATE CLUSTERED COLUMNSTORE INDEX ClusteredIndex_d473567f7ea04d7aafcac5364c241e09
ON MyFactTable
WITH (DROP_EXISTING = ON);
```

セグメントの削除を理解する

それぞれの行グループには、テーブルの 1 つの列につき 1 つの列セグメントが含まれます。それぞれの列セグメントは一緒に圧縮され、物理メディアに格納されます。

セグメントを読み取らずに高速に削除できるように、各セグメントにメタデータがあります。データ型の選択は、列ストアインデックスに対するクエリの一般的なフィルター述語に基づくクエリパフォーマンスに大きな影響を与える可能性があります。詳細については、「セグメントの削除」を参照してください。

以下は、列ストアインデックスを作成して保守するためのタスクです。

タスク	関連記事	メモ
テーブルを列ストアとして作成する。	CREATE TABLE (Transact-SQL)	SQL Server 2016 (13.x) 以降、テーブルをクラスター化列ストアインデックスとして作成できます。最初に行ストアテーブルを作成して列ストアに変換する必要はありません。
列ストアインデックスを持つメモリテーブルを作成します。	CREATE TABLE (Transact-SQL)	SQL Server 2016 (13.x) 以降、列ストアインデックスを持つ、メモリ最適化テーブルを作成できます。列ストアインデックスは、テーブルの作成後に、ALTER TABLE ADD INDEX 構文を使用して追加することもできます。
行ストアテーブルを列ストアに変換する。	CREATE COLUMNSTORE INDEX (Transact-SQL)	既存のヒープまたは B ツリーを列ストアに変換します。この変換を実行するときの既存のインデックスとインデックス名の処理方法を例示します。
列ストアテーブルを行ストアに変換する。	CREATE CLUSTERED INDEX (Transact-SQL) または列ストアテーブルを行ストアヒープに戻す	この変換は通常は必要ありませんが、状況によっては必要になる場合があります。列ストアをヒープまたはクラスター化インデックスに変換する方法を例示します。
行ストアテーブルで列ストアインデックスを作成する。	CREATE COLUMNSTORE INDEX (Transact-SQL)	行ストアテーブルでは列ストアインデックスを 1 つ使用できます。 SQL Server 2016 (13.x) 以降、列ストアインデックスにフィルター条件を指定できるようになりました。基本構文を例示します。
運用分析のパフォーマンスの高いインデックスを作成する。	リアルタイム運用分析を始めるための列ストアの活用	補完的な列ストアインデックスと B ツリーインデックスを作成する方法について説明します。OLTP クエリでは B ツリーインデックスが使用され、分析クエリでは列ストアインデックスが使用されます。
データウェアハウス用のパフォーマンスの高い列ストアインデックスを作成する。	データウェアハウジングにおける列ストアインデックス	列ストアテーブルで B ツリーインデックスを使用して、パフォーマンスの高いデータウェアハウスクエリを作成する方法について説明します。
B ツリーインデックスを使用して列ストアインデックスに主キー制約を適用する	データウェアハウスでの列ストアインデックス	B ツリーインデックスと列ストアインデックスを組み合わせて、列ストアインデックスに主キー制約を適用する方法を示します。
列ストアインデックスを削除する	DROP INDEX (Transact-SQL)	列ストアインデックスは、B ツリーインデックスが使用する標準の DROP INDEX 構文を使って削除します。クラスター化列ストアインデックスを削除すると、列ストアテーブルがヒープに変換されます。
列ストアインデックスから行を削除する	DELETE (Transact-SQL)	DELETE (Transact-SQL) を使用して行を削除します。列ストア行: SQL Server は行を論理的に削除されたとしてマークしますが、インデックスが再構築されるまで行の物理記憶領域を再確保することはありません。デルタストア行: SQL Server は論理的および物理的に行を削除します。
列ストアインデックスの行を更新する	UPDATE (Transact-SQL)	UPDATE (Transact-SQL) を使用して行を更新します。列ストア行: SQL Server は行を論理的に削除されたとしてマークし、更新された行をデルタストアに挿入します。デルタストア行: SQL Server は、デルタストアの行を更新します。
デルタストアのすべての行を強制的に列ストアに移動します。	ALTER INDEX (Transact-SQL) ... 再構築하는 방법 クエリのパフォーマンスを向上させてリソースの消費を削減するためにインデックスのメンテナンスを最適化する	`ALTER INDEX` に `REBUILD` オプションを指定すると、すべての行が列ストアに強制的に移動されます。
列ストアインデックスを再編成する	ALTER INDEX (Transact-SQL)	`ALTER INDEX ... REORGANIZE` は、列ストアインデックスをオンラインでデフラグします。
テーブルと列ストアインデックスをマージする。	MERGE (Transact-SQL)

空の列ストアインデックスを作成するには:

SQL Server または SQL Database については、CREATE TABLE (Transact-SQL) を参照してください。
Azure Synapse Analytics については、「CREATE TABLE (Azure Synapse Analytics)」を参照してください。

既存の行ストアヒープまたは B ツリーインデックスをクラスター化列ストアインデックスに変換する方法、または非クラスター化列ストアインデックスを作成する方法の詳細については、「CREATE COLUMNSTORE INDEX (Transact-SQL)」を参照してください。

次の方法で共有

列ストア インデックス - 設計ガイダンス

前提条件

データ要件を認識する

ニーズに最適な列ストア インデックスを選ぶ

データウェアハウスの大規模テーブルにはクラスター化列ストアインデックスを使用する。

大規模なデータ ウェアハウス テーブルに対して順序付き列ストア インデックスを使用する

Bツリー非クラスター化インデックスを追加して、テーブル検索の効率を向上させる

非クラスター化カラムストア インデックスを使用してリアルタイムで分析を行う

テーブルのパーティションを使用してデータ管理とクエリのパフォーマンスを高める

パーティションを使用してデータを管理しやすくする

パーティションを使用してクエリのパフォーマンスを向上させる

列ストア インデックスに使用するパーティションを少なくする

適切なデータの圧縮方法を選ぶ

列ストア圧縮を使用して最適なクエリ パフォーマンスを実現する

アーカイブ圧縮を使用して最適なデータ圧縮を実現する

行ストア テーブルを列ストア インデックスに変換するときに最適化を使用する

MAXDOP を使用して行グループの品質を向上させる

B ツリー インデックスの並べ替え順序を保持する

セグメントの削除を理解する

関連作業

関連するコンテンツ

フィードバック

その他のリソース