在 Microsoft Fabric 的倉儲資料表中產生唯一識別碼

發行項
11/20/2024

適用於✅：Microsoft Fabric 的倉儲

這是資料倉儲中將唯一識別碼指派給資料表每個資料列的常見需求。在 SQL Server 型環境中，這通常是藉由在數據表中建立識別數據行來完成，不過目前在 Microsoft Fabric 的倉儲中不支援此功能。相反地，您必須使用因應措施技術。我們提供了兩個替代方案。

本文說明在倉儲數據表中產生唯一標識符的因應措施技術。

方法 1

當您需要建立識別值時，此方法最適用，但值的順序並不重要（非查詢值是可接受的）。

唯一值會在將數據插入數據表的程式代碼中產生。

若要使用此方法建立唯一數據，請建立包含儲存唯一標識符值之數據行的數據表。數據行數據類型應該設定為 bigint。您也應將資料行定義為 NOT NULL，以確保為每個資料列指派識別碼。

下列 T-SQL 程式代碼範例會在架構中建立名為 Orders_with_Identifier 的 dbo 範例數據表，其中數據 Row_ID 行可作為唯一索引鍵。

--Drop a table named 'Orders_with_Identifier' in schema 'dbo', if it exists
IF OBJECT_ID('[dbo].[Orders_with_Identifier]', 'U') IS NOT NULL
    DROP TABLE [dbo].[Orders_with_Identifier];
GO

CREATE TABLE [dbo].[Orders_with_Identifier] (
    [Row_ID] BIGINT NOT NULL,
    [O_OrderKey] BIGINT NULL,
    [O_CustomerKey] BIGINT NULL,
    [O_OrderStatus] VARCHAR(1) NULL,
    [O_TotalPrice] DECIMAL(15, 2) NULL,
    [O_OrderDate] DATE NULL,
    [O_OrderPriority] VARCHAR(15) NULL,
    [O_Clerk] VARCHAR (15) NULL,
    [O_ShipPriority] INT NULL,
    [O_Comment] VARCHAR (79) NULL
);

當您透過 T-SQL 腳本或應用程式程式代碼將資料列插入資料表時，或使用函式產生唯一的數據Row_IDNEWID()。此函式會產生 uniqueidentifier 類型的唯一值，然後可以轉換並儲存為 bigint。

下列程式代碼會將數據列插入數據表中 dbo.Orders_with_Identifier 。數據行的值 Row_ID 會藉由轉換函式傳 newid() 回的值來計算。函式不需要 ORDER BY 子句，而且會為每個記錄產生新的值。
```
--Insert new rows with unique identifiers
INSERT INTO [dbo].[Orders_with_Identifier]
SELECT
    CONVERT(BIGINT, CONVERT(VARBINARY, CONCAT(NEWID(), GETDATE()))) AS [Row_ID],
    [src].[O_OrderKey],
    [src].[O_CustomerKey],
    [src].[O_OrderStatus],
    [src].[O_TotalPrice],
    [src].[O_OrderDate],
    [src].[O_OrderPriority],
    [src].[O_Clerk],
    [src].[O_ShipPriority],
    [src].[O_Comment]
FROM [dbo].[Orders] AS [src];
```

方法 2

當您需要建立循序身分識別值時，這個方法最適用，但應該謹慎地在較大的數據集上使用，因為它可能比替代方法慢。也應該同時針對多個進程同時插入數據做考慮，因為這可能會產生重複的值。

若要使用此方法建立唯一數據，請建立包含儲存唯一標識符值之數據行的數據表。數據行數據類型應該設定為 int 或 bigint，視您預期儲存的數據量而定。您也應將資料行定義為 NOT NULL，以確保為每個資料列指派識別碼。

下列 T-SQL 程式代碼範例會在架構中建立名為 Orders_with_Identifier 的 dbo 範例數據表，其中數據 Row_ID 行可作為唯一索引鍵。

--Drop a table named 'Orders_with_Identifier' in schema 'dbo', if it exists
IF OBJECT_ID('[dbo].[Orders_with_Identifier]', 'U') IS NOT NULL
    DROP TABLE [dbo].[Orders_with_Identifier];
GO

CREATE TABLE [dbo].[Orders_with_Identifier] (
    [Row_ID] BIGINT NOT NULL,
    [O_OrderKey] BIGINT NULL,
    [O_CustomerKey] BIGINT NULL,
    [O_OrderStatus] VARCHAR(1) NULL,
    [O_TotalPrice] DECIMAL(15, 2) NULL,
    [O_OrderDate] DATE NULL,
    [O_OrderPriority] VARCHAR(15) NULL,
    [O_Clerk] VARCHAR (15) NULL,
    [O_ShipPriority] INT NULL,
    [O_Comment] VARCHAR (79) NULL
);
GO

在將資料列插入資料表之前，必須判定儲存在資料表中的最後一個識別碼值。您可以藉由擷取最大的識別碼值來執行此動作。此值應該指派給變數，以便在將資料列插入資料表時 (在下一個步驟中) 可以參考。

下列程式碼會將最後一個識別碼指派給名為 @MaxID 的變數。
```
--Assign the last identifier value to a variable
--If the table doesn't contain any rows, assign zero to the variable
DECLARE @MaxID AS BIGINT;

IF EXISTS(SELECT * FROM [dbo].[Orders_with_Identifier])
    SET @MaxID = (SELECT MAX([Row_ID]) FROM [dbo].[Orders_with_Identifier]);
ELSE
    SET @MaxID = 0;
```
當您將資料列插入資料表時，會將 @MaxID 變數的值新增至 ROW_NUMBER 函數傳回的值，藉以計算唯一和循序編號。此函式是一個視窗函式，可計算從開始的 1循序數據列編號。

下列 T-SQL 程式代碼會在與步驟 2 中的腳本相同的批次中執行，它會將數據列插入數據表中 Orders_with_Identifier 。 Row_ID 資料行的值藉由將 @MaxID 變數新增至 ROW_NUMBER 函數傳回的值來計算。函數必須有 ORDER BY 子句，該定名定義結果集中資料列的邏輯順序。不過，當設定為 SELECT NULL時，不會強制套用任何邏輯順序，這表示會任意指派標識符值。這個 ORDER BY 子句會導致執行時間更快。
```
--Insert new rows with unique identifiers
INSERT INTO [dbo].[Orders_with_Identifier]
SELECT
    @MaxID + ROW_NUMBER() OVER(ORDER BY (SELECT NULL)) AS [Row_ID],
    [src].[O_OrderKey],
    [src].[O_CustomerKey],
    [src].[O_OrderStatus],
    [src].[O_TotalPrice],
    [src].[O_OrderDate],
    [src].[O_OrderPriority],
    [src].[O_Clerk],
    [src].[O_ShipPriority],
    [src].[O_Comment]
FROM [dbo].[Orders] AS [src];
```

共用方式為

在 Microsoft Fabric 的倉儲資料表中產生唯一識別碼

方法 1

方法 2

意見反應

其他資源

共用方式為

在 Microsoft Fabric 的倉儲資料表中產生唯一識別碼

方法 1

方法 2

相關內容

意見反應

其他資源