資料列取樣轉換
適用於: SQL Server Azure Data Factory 中的 SSIS Integration Runtime
「資料列取樣」轉換是用來取得隨機選取的輸入資料集子集。 您可以指定輸出範例的確實大小,以及指定隨機號碼產生器的種子資料 (Seed)。
可用於隨機取樣的應用程式有許多種。 例如,某公司希望隨機選取 50 名員工接受抽獎獎項,即可在員工資料庫上使用「資料列取樣」轉換產生正確的獲獎者數目。
在封裝部署期間,「資料列取樣」轉換對於建立小型但具代表性的資料集來說亦相當實用。 您可以運用豐富的代表性資料測試封裝執行和資料庫轉換,而由於使用隨機取樣而非整個資料集,因此速度更快。 由於測試封裝所使用的取樣資料集大小始終相同,因此使用取樣子集亦可讓識別封裝中的效能問題更為容易。
此轉換與「百分比取樣」轉換相似,但後者是藉由選取某個百分比的輸入資料列建立取樣資料集。 請參閱 百分比取樣轉換。
設定資料列取樣轉換
「資料列取樣」轉換會藉由選取指定數目的轉換輸入資料列來建立取樣資料集。 由於是從轉換輸入隨機選取資料列,因此結果取樣即為輸入的代表。 您也可以指定隨機號碼產生器使用的種子資料,以影響轉換選取資料列的方式。
使用相同轉換輸入上的相同隨機種子資料,會固定建立相同的取樣輸出。 如果未指定種子,轉換會使用作業系統的滴答計數建立隨機號碼。 因此,您可以在測試過程中使用相同的種子,以便在開發和測試封裝期間驗證轉換結果,然後在封裝移至實際執行階段時變更為隨機種子。
資料列取樣轉換包括 SamplingValue 自訂屬性。 屬性運算式可以在載入封裝時更新這個屬性。 如需詳細資訊,請參閱 Integration Services (SSIS) 運算式、在封裝中使用屬性運算式和轉換自訂屬性。
此轉換有一個輸入和兩個輸出。 但沒有錯誤輸出。
您可以透過 SSIS 設計師或以程式設計方式設定屬性。
[進階編輯器] 對話方塊會反映能以程式設計的方式設定之屬性。 如需有關可以在 [進階編輯器] 對話方塊中或以程式設計方式設定之屬性的詳細資訊,請按下列其中一個主題:
如需有關如何設定屬性的詳細資訊,請參閱。
資料列取樣轉換編輯器 (取樣頁面)
使用 [資料列取樣轉換編輯器] 對話方塊,即可將輸入的一部分分割為指定資料列數目的取樣。 這個轉換會將輸入分成兩個不同的輸出。
選項。
資料列數目
指定輸入中的資料列數目作為取樣。
此屬性的值可以使用屬性運算式指定。
取樣輸出名稱
提供包含取樣資料列之輸出的唯一名稱。 提供的名稱將顯示在 SSIS 設計師內。
未選取的輸出名稱
提供輸出的唯一名稱,其中包含從取樣排除的資料列。 提供的名稱將顯示在 SSIS 設計師內。
使用下列隨機種子
指定轉換用來建立取樣之隨機號碼產生器的取樣種子。 只建議用於開發和測試。 如果未指定隨機種子,則轉換會使用 Microsoft Windows 滴答計數作為種子。