SELECT - GROUP BY- Transact-SQL

[アーティクル]
05/23/2023

適用対象: SQL Server Azure SQL Database Azure SQL Managed Instance Azure Synapse Analytics Analytics Platform System (PDW) Microsoft Fabric の SQL 分析エンドポイント Microsoft Fabric Warehouse Microsoft Fabric SQL Database

クエリ結果を行のグループに分割する SELECT ステートメント句。これは通常、グループごとに 1 つまたは複数の集計を実行することで行われます。 SELECT ステートメントでは、グループごとに 1 つの行が返されます。

構文

Transact-SQL 構文表記規則

-- Syntax for SQL Server and Azure SQL Database   
-- ISO-Compliant Syntax  
  
GROUP BY {
      column-expression  
    | ROLLUP ( <group_by_expression> [ ,...n ] )  
    | CUBE ( <group_by_expression> [ ,...n ] )  
    | GROUPING SETS ( <grouping_set> [ ,...n ]  )  
    | () --calculates the grand total 
} [ ,...n ] 
 
<group_by_expression> ::=  
      column-expression  
    | ( column-expression [ ,...n ] )    
   
<grouping_set> ::=  
      () --calculates the grand total  
    | <grouping_set_item>  
    | ( <grouping_set_item> [ ,...n ] )  
  
<grouping_set_item> ::=  
      <group_by_expression>  
    | ROLLUP ( <group_by_expression> [ ,...n ] )  
    | CUBE ( <group_by_expression> [ ,...n ] )  
  

-- For backward compatibility only.
-- Non-ISO-Compliant Syntax for SQL Server and Azure SQL Database 
  
GROUP BY {
       ALL column-expression [ ,...n ] 
    | column-expression [ ,...n ]  WITH { CUBE | ROLLUP }    
       }

-- Syntax for Azure Synapse Analytics 
  
GROUP BY {
      column-name [ WITH (DISTRIBUTED_AGG) ]  
    | column-expression
    | ROLLUP ( <group_by_expression> [ ,...n ] ) 
} [ ,...n ]

-- Syntax for Parallel Data Warehouse  
  
GROUP BY {
      column-name [ WITH (DISTRIBUTED_AGG) ]  
    | column-expression
} [ ,...n ]

引数

column-expression

列を指定するか、列で集計計算以外を指定します。この列は、テーブル、派生テーブル、またはビューに属することができます。この列は、SELECT ステートメントの FROM 句に表示する必要がありますが、SELECT リストに表示する必要はありません。

有効な式については、式に関するページを参照してください。

この列は、SELECT ステートメントの FROM 句に表示する必要がありますが、SELECT リストに表示する必要はありません。しかし、<select> リスト内にある非集計式のテーブルやビューの列は、それぞれ GROUP BY リストに含まれている必要があります。

次のようなステートメントは使用できます。

SELECT ColumnA, ColumnB FROM T GROUP BY ColumnA, ColumnB;  
SELECT ColumnA + ColumnB FROM T GROUP BY ColumnA, ColumnB;  
SELECT ColumnA + ColumnB FROM T GROUP BY ColumnA + ColumnB;  
SELECT ColumnA + ColumnB + constant FROM T GROUP BY ColumnA, ColumnB;

次のようなステートメントは使用できません。

SELECT ColumnA, ColumnB FROM T GROUP BY ColumnA + ColumnB;  
SELECT ColumnA + constant + ColumnB FROM T GROUP BY ColumnA + ColumnB;

列の式には次を含めることはできません。

SELECT リストで定義されている列の別名。 FROM 句で定義されている派生テーブルの列の別名を使用できます。
text、ntext、または image 型の列。ただし、text、ntext、または image の列は、有効なデータ型の値を返す関数の引数として使用できます。たとえば、式では、SUBSTRING() および CAST() を使用できます。これは、HAVING 句内の式にも適用されます。
xml データ型メソッド。 xml データ型メソッドを使用するユーザー定義関数を含めることができます。 xml データ型メソッドを使用する計算列を含めることができます。
サブクエリ。エラー 144 が返されます。
インデックス付きビューの列。

GROUP BY column-expression [ ,...n ]

1 つまたは複数の列の式のリスト内の値に従って SELECT ステートメントの結果をグループ化します。

たとえば、このクエリは、Country (国)、Region (地域)、および Sales (売上) の列を持つ Sales テーブルを作成します。 4 つの行を挿入し、そのうちの 2 行は Country と Region の一致する値を持ちます。

CREATE TABLE Sales ( Country VARCHAR(50), Region VARCHAR(50), Sales INT );

INSERT INTO sales VALUES (N'Canada', N'Alberta', 100);
INSERT INTO sales VALUES (N'Canada', N'British Columbia', 200);
INSERT INTO sales VALUES (N'Canada', N'British Columbia', 300);
INSERT INTO sales VALUES (N'United States', N'Montana', 100);

Sales テーブルには、次の行が含まれています。

Country	Region	売上
Canada	Alberta	100
Canada	British Columbia	200
Canada	British Columbia	300
United States	モンタナ	100

次のクエリでは、Country と Region をグループ化し、値の組み合わせごとの合計を返します。

SELECT Country, Region, SUM(sales) AS TotalSales
FROM Sales
GROUP BY Country, Region;

Country と Region には値の 3 つの組み合わせがあるため、クエリ結果には 3 つの行ができます。 Canada と British Columbia の TotalSales は、2 つの行の合計です。

Country	リージョン	TotalSales
Canada	Alberta	100
Canada	British Columbia	500
United States	モンタナ	100

GROUP BY ROLLUP

列の式の組み合わせごとにグループを作成します。さらに、結果を小計と総計に "ロールアップ" します。これを行うため、右から左に移動して、列の式の数を減らし、それに対してグループと集計を作成します。

列の順序は ROLLUP 出力に影響を与えます。結果セット内の行数に影響を与えることもあります。

たとえば、GROUP BY ROLLUP (col1, col2, col3, col4) は次の一覧の列の式の組み合わせごとにグループを作成します。

col1, col2, col3, col4
col1, col2, col3, NULL
col1, col2, NULL, NULL
col1, NULL, NULL, NULL
NULL, NULL, NULL, NULL --これが総計です

前の例のテーブルを使用して、このコードは、単純な GROUP BY の代わりに GROUP BY ROLLUP 操作を実行します。

SELECT Country, Region, SUM(Sales) AS TotalSales
FROM Sales
GROUP BY ROLLUP (Country, Region);

クエリ結果は、ROLLUP なしの単純な GROUP BY と同じ集計になります。さらに、Country の値ごとの小計を作成します。最後に、すべての行の総計を示します。結果は次のようになります。

Country	リージョン	TotalSales
Canada	Alberta	100
Canada	British Columbia	500
Canada	NULL	600
United States	モンタナ	100
United States	NULL	100
NULL	NULL	700

GROUP BY CUBE ( )

GROUP BY CUBE では、列の可能なすべての組み合わせのグループを作成します。 GROUP BY CUBE (a, b) の場合、結果は (a, b)、(NULL, b)、(a, NULL)、および (NULL, NULL) の一意の値のグループになります。

このコードは、前の例のテーブルを使用して、Country と Region で GROUP BY CUBE 操作を実行します。

SELECT Country, Region, SUM(Sales) AS TotalSales
FROM Sales
GROUP BY CUBE (Country, Region);

クエリの結果は、(Country, Region)、(NULL, Region)、(Country, NULL)、および (NULL, NULL) の一意の値のグループになります。結果は、次のようになります。

Country	リージョン	TotalSales
Canada	Alberta	100
NULL	Alberta	100
Canada	British Columbia	500
NULL	British Columbia	500
United States	モンタナ	100
NULL	モンタナ	100
NULL	NULL	700
Canada	NULL	600
United States	NULL	100

GROUP BY GROUPING SETS ( )

GROUPING SETS オプションを使用すると、複数の GROUP BY 句を 1 つの GROUP BY 句に統合できます。結果は、指定したグループの UNION ALL と同じになります。

たとえば、GROUP BY ROLLUP (Country, Region) と GROUP BY GROUPING SETS ( ROLLUP (Country, Region) ) は同じ結果を返します。

GROUPING SETS に 2 つ以上の要素がある場合、結果はそれらの要素の和集合になります。この例では、Country と Region の ROLLUP と CUBE の結果の和集合を返します。

SELECT Country, Region, SUM(Sales) AS TotalSales
FROM Sales
GROUP BY GROUPING SETS ( ROLLUP (Country, Region), CUBE (Country, Region) );

結果は、この 2 つの GROUP BY ステートメントの和集合を返すクエリと同じです。

SELECT Country, Region, SUM(Sales) AS TotalSales
FROM Sales
GROUP BY ROLLUP (Country, Region)
UNION ALL
SELECT Country, Region, SUM(Sales) AS TotalSales
FROM Sales
GROUP BY CUBE (Country, Region);

SQL では、GROUPING SETS リストに対して生成された重複するグループの統合は行われません。たとえば、GROUP BY ( (), CUBE (Country, Region) ) では、両方の要素が総計の行を返し、両方の行が結果に表示されます。

GROUP BY ()

総計を生成する空のグループを指定します。これは、GROUPING SET の要素の 1 つとして役立ちます。たとえば、このステートメントにより、各国や地域の売上合計と、すべての国や地域の総計が提供されます。

SELECT Country, SUM(Sales) AS TotalSales
FROM Sales
GROUP BY GROUPING SETS ( Country, () );

GROUP BY ALL column-expression [ ,...n ]

適用対象:SQL Server と Azure SQL Database

Note

この構文は、旧バージョンとの互換性を維持するためだけに提供されます。将来のバージョンでは削除される予定です。新規の開発作業ではこの構文を使用しないようにし、現在この構文を使用しているアプリケーションは修正することを検討してください。

WHERE 句の検索条件を満たしているかどうかに関係なく、結果にすべてのグループを含めることを指定します。検索条件を満たしていないグループの集計は NULL になります。

GROUP BY ALL:

クエリ内に WHERE 句がある場合、リモートテーブルにアクセスするクエリでは、サポートされません。
FILESTREAM 属性を持つ列では失敗します。

GROUP BY column-expression [ ,...n ] WITH { CUBE | ROLLUP }

適用対象:SQL Server と Azure SQL Database

Note

この構文は、旧バージョンとの互換性を維持するためだけに提供されます。新規の開発作業ではこの構文を使用しないようにし、現在この構文を使用しているアプリケーションは修正することを検討してください。

WITH (DISTRIBUTED_AGG)

適用対象: Azure Synapse Analytics および Analytics Platform System (PDW)

DISTRIBUTED_AGG クエリヒントは、超並列処理 (MPP) システムで、特定の列に対し、集計を実行する前にテーブルを強制的に再配布します。 DISTRIBUTED_AGG クエリヒントを持つことができるのは、GROUP BY 句内で 1 つの列だけです。クエリが完了したら、再配布されたテーブルは破棄されます。元のテーブルは変更されません。

注:DISTRIBUTED_AGG クエリヒントは、Analytics Platform System (PDW) の旧バージョンとの下位互換性を保つために提供されており、ほとんどのクエリでパフォーマンスが向上することはありません。既定では、MPP は集計のパフォーマンスを向上させるために必要なデータを既に再分配しています。

全般的な解説

GROUP BY が SELECT ステートメントと連携するしくみ

SELECT リスト:

ベクター集計。 SELECT リストに集計関数が含まれている場合は、GROUP BY によって各グループの集計値が計算されます。これらはベクター集計値と呼ばれます。
Distinct 集計。 AVG (DISTINCT column_name)、COUNT (DISTINCT column_name)、および UM (DISTINCT column_name) は ROLLUP、CUBE、および GROUPING SETS でサポートされています。

WHERE 句:

SQL では、WHERE 句の条件と一致しない行は、グループ化操作の実行前に削除されます。

HAVING 句:

SQL では、HAVING 句を使用して、結果セット内のグループをフィルターできます。

ORDER BY 句:

結果セットを並べ替えるには、ORDER BY 句を使用します。 GROUP BY 句では、結果セットの並べ替えが行われません。

NULL 値:

グループ列に NULL 値が含まれている場合、すべての NULL 値は等しいものと見なされ、1 つのグループにまとめられます。

制限事項と制約事項

適用対象:SQL Server (2008 以降) および Azure Synapse Analytics

最大容量

ROLLUP、CUBE、または GROUPING SETS を使用する GROUP BY 句の場合、式の最大数は 32 です。グループの最大数は 4096 (2¹²) です。次の例は、GROUP BY 句に 4096 を超えるグループがあるために失敗します。

次の例では、4097 (2¹² + 1) 個のグループ化セットが生成され、失敗します。
```
GROUP BY GROUPING SETS( CUBE(a1, ..., a12), b )  
```
次の例では、4097 (2¹² + 1) 個のグループが生成され、失敗します。 CUBE () と () の両方のグループ化セットで総計行が生成され、重複したグループ化セットは削除されません。
```
GROUP BY GROUPING SETS( CUBE(a1, ..., a12), ())  
```
この例では、下位互換性のある構文を使用します。 8192 (2¹³) 個のグループ化セットが生成され、失敗します。
```
GROUP BY CUBE (a1, ..., a13)   
GROUP BY a1, ..., a13 WITH CUBE   
```
CUBE または ROLLUP を含まない下位互換性のある GROUP BY 句では、項目ごとのグループの数はクエリにかかわる GROUP BY 列のサイズ、集計列、集計値によって制限されます。この数制限は、クエリの中間結果を保持するために中間作業テーブル上に必要な 8,060 バイトを基本にしています。 CUBE または ROLLUP を指定している場合は、最大 12 個のグループ化式を使用できます。

ISO および ANSI SQL-2006 の GROUP BY 機能のサポート

GROUP BY 句では、SQL-2006 標準規格に含まれているすべての GROUP BY 機能をサポートしています。ただし、次のような構文上の例外があります。

GROUP BY 句では、明示的な GROUPING SETS リストに含まれていないグループ化セットは使用できません。たとえば、GROUP BY Column1, (Column2, ...ColumnN) は標準規格で使用できますが、Transact-SQL では使用できません。 Transact SQL は、同じ意味の GROUP BY C1, GROUPING SETS ((Column2, ...ColumnN)) と GROUP BY Column1, Column2, ... ColumnN をサポートしています。これらは、前に示した GROUP BY の例と意味的に同じです。これには、GROUP BY Column1, (Column2, ...ColumnN) が意味的に異なる GROUP BY C1, GROUPING SETS ((Column2, ...ColumnN)) と誤って解釈される可能性を回避する目的があります。
グループ化セット内でグループ化セットを使用することはできません。たとえば、GROUP BY GROUPING SETS (A1, A2,...An, GROUPING SETS (C1, C2, ...Cn)) は SQL-2006 標準規格で使用できますが、Transact-SQL では使用できません。 Transact-SQL では、最初の GROUP BY の例と意味的に同じで、構文がより明確な GROUP BY GROUPING SETS( A1, A2,...An, C1, C2, ...Cn ) または GROUP BY GROUPING SETS( (A1), (A2), ... (An), (C1), (C2), ... (Cn) ) を使用できます。
GROUP BY [ALL/DISTINCT] は、列の式を含む単純な GROUP BY 句でのみ使用できます。 GROUPING SETS、ROLLUP、CUBE、WITH CUBE、WITH ROLLUP のコンストラクトでは使用できません。 ALL は既定値であり暗黙的です。また、下位互換性のある構文でのみ使用できます。

サポートされる GROUP BY 機能の比較

次の表に、SQL のバージョンに基づいてサポートされる GROUP BY 機能と、データベースの互換性レベルを示します。

特徴量	SQL Server Integration Services	SQL Server 互換性レベル 100 以上	SQL Server 2008 以降で互換性レベル 90
DISTINCT 集計	WITH CUBE および WITH ROLLUP ではサポートされていません。	WITH CUBE、WITH ROLLUP、GROUPING SETS、CUBE、および ROLLUP でサポートされています。	互換性レベル 100 と同じです。
GROUP BY 句内の、CUBE または ROLLUP の名前を持つユーザー定義関数	GROUP BY 句では、ユーザー定義関数 dbo.cube(arg1,...argN) または dbo.rollup(arg1, ...argN) を使用できます。例: `SELECT SUM (x) FROM T GROUP BY dbo.cube(y);`	GROUP BY 句では、ユーザー定義関数 dbo.cube (arg1,...argN) または dbo.rollup(arg1,...argN) は使用できません。例: `SELECT SUM (x) FROM T GROUP BY dbo.cube(y);` "キーワード 'cube'\|'rollup' の周辺に正しくない構文があります" というエラーメッセージが返されます。この問題を回避するには、`dbo.cube` を `[dbo].[cube]` に、または `dbo.rollup` を `[dbo].[rollup]` に置き換えます。次の例は使用できます: `SELECT SUM (x) FROM T GROUP BY [dbo].[cube](y);`	GROUP BY 句では、ユーザー定義関数 dbo.cube (arg1,...argN) または dbo.rollup(arg1,...argN) を使用できます例: `SELECT SUM (x) FROM T GROUP BY dbo.cube(y);`
GROUPING SETS	サポートされていません	サポートされています	サポートされています
CUBE	サポートされていません	サポート対象	サポートされていません
ROLLUP	サポートされていません	サポート対象	サポートされていません
GROUP BY () などの総計	サポートされていません	サポートされています	サポートされています
GROUPING_ID 関数	サポートされていません	サポートされています	サポートされています
GROUPING 関数	サポートされています	サポート対象	サポートされています
WITH CUBE	サポートされています	サポート対象	サポートされています
WITH ROLLUP	サポートされています	サポート対象	サポートされています
WITH CUBE または WITH ROLLUP の重複したグループ化の削除	サポートされています	サポート対象	サポートされています

例

A. 単純な GROUP BY 句を使用する

次の例では、SalesOrderID テーブルから SalesOrderDetail ごとの合計を取得します。この例では、AdventureWorks を使用します。

SELECT SalesOrderID, SUM(LineTotal) AS SubTotal  
FROM Sales.SalesOrderDetail AS sod  
GROUP BY SalesOrderID  
ORDER BY SalesOrderID;

B. GROUP BY 句を複数のテーブルで使用する

次の例では、City テーブルと Address テーブルを結合したものから、EmployeeAddress ごとに従業員の数を取得します。この例では、AdventureWorks を使用します。

SELECT a.City, COUNT(bea.AddressID) EmployeeCount  
FROM Person.BusinessEntityAddress AS bea   
    INNER JOIN Person.Address AS a  
        ON bea.AddressID = a.AddressID  
GROUP BY a.City  
ORDER BY a.City;

C. GROUP BY 句を式と共に使用する

次の例では、DATEPART 関数を使用して各年の売上合計を取得します。 SELECT リストと GROUP BY 句の両方に同じ式が存在する必要があります。

SELECT DATEPART(yyyy,OrderDate) AS N'Year'  
    ,SUM(TotalDue) AS N'Total Order Amount'  
FROM Sales.SalesOrderHeader  
GROUP BY DATEPART(yyyy,OrderDate)  
ORDER BY DATEPART(yyyy,OrderDate);

D. GROUP BY 句を HAVING 句と共に使用する

次の例では、HAVING 句で生成されたグループのうち結果セットに含めるグループを、GROUP BY 句を使用して指定します。

SELECT DATEPART(yyyy,OrderDate) AS N'Year'  
    ,SUM(TotalDue) AS N'Total Order Amount'  
FROM Sales.SalesOrderHeader  
GROUP BY DATEPART(yyyy,OrderDate)  
HAVING DATEPART(yyyy,OrderDate) >= N'2003'  
ORDER BY DATEPART(yyyy,OrderDate);

例 :Azure Synapse Analytics と Parallel Data Warehouse

E. GROUP BY 句の基本的な使用方法

次の例では、各日のすべての売上の合計金額を検索します。各日に、すべての売上の合計を含む 1 つの行が返されます。

-- Uses AdventureWorksDW  
  
SELECT OrderDateKey, SUM(SalesAmount) AS TotalSales FROM FactInternetSales  
GROUP BY OrderDateKey ORDER BY OrderDateKey;

F. DISTRIBUTED_AGG ヒントの基本的な使用方法

この例では、DISTRIBUTED_AGG クエリヒントを使用して、集計を実行する前に CustomerKey 列でテーブルをシャッフルするようにアプライアンスに強制します。

-- Uses AdventureWorksDW  
  
SELECT CustomerKey, SUM(SalesAmount) AS sas  
FROM FactInternetSales  
GROUP BY CustomerKey WITH (DISTRIBUTED_AGG)  
ORDER BY CustomerKey DESC;

G. GROUP BY の構文の種類

選択リストに集計がない場合、選択リスト内の各列を GROUP BY リストに含める必要があります。選択リスト内の計算列は、GROUP BY リストに一覧表示することができますが、必須ではありません。構文が有効な SELECT ステートメントの例を次に示します。

-- Uses AdventureWorks  
  
SELECT LastName, FirstName FROM DimCustomer GROUP BY LastName, FirstName;  
SELECT NumberCarsOwned FROM DimCustomer GROUP BY YearlyIncome, NumberCarsOwned;  
SELECT (SalesAmount + TaxAmt + Freight) AS TotalCost FROM FactInternetSales GROUP BY SalesAmount, TaxAmt, Freight;  
SELECT SalesAmount, SalesAmount*1.10 SalesTax FROM FactInternetSales GROUP BY SalesAmount;  
SELECT SalesAmount FROM FactInternetSales GROUP BY SalesAmount, SalesAmount*1.10;

H. 複数の GROUP BY 式で GROUP BY を使用する

次の例では、複数の GROUP BY 条件を使用して結果をグループ化します。各 OrderDateKey グループ内に、DueDateKey によって区別できるサブグループがある場合、結果セットに新しいグループが定義されます。

-- Uses AdventureWorks  
  
SELECT OrderDateKey, DueDateKey, SUM(SalesAmount) AS TotalSales   
FROM FactInternetSales
GROUP BY OrderDateKey, DueDateKey   
ORDER BY OrderDateKey;

I. GROUP BY 句を HAVING 句と共に使用する

次の例では、HAVING 句を使用して、結果セットに含める必要がある GROUP BY 句で生成されたグループを指定します。注文日が 2004 年以降のグループのみが結果に含まれます。

-- Uses AdventureWorks  
  
SELECT OrderDateKey, SUM(SalesAmount) AS TotalSales   
FROM FactInternetSales  
GROUP BY OrderDateKey   
HAVING OrderDateKey > 20040000   
ORDER BY OrderDateKey;

参照

GROUPING_ID (Transact-SQL)
GROUPING (Transact-SQL)
SELECT (Transact-SQL)
SELECT 句 (Transact-SQL)

次の方法で共有