針對 Windows HLK 中的儲存空間直接存取 (S2D) 執行叢集測試
摘要
本檔包含合作夥伴和原始設備製造商的指示, (OEM) 如何使用 Windows 硬體實驗室套件 (HLK 中包含的測試,先前稱為 HCK) ,以驗證儲存空間直接存取 (S2D) 的特定硬體組態。
重要
本檔中的指示僅供測試之用。 它們 不適用於 終端使用者,或設定系統以供生產環境使用。
必要條件
- 硬體設定必須符合 S2D 需求,而且必須先通過所有叢集驗證測試,包括針對 S2D 新增的新測試。
- 您必須下載、安裝及設定支援最新Windows Server Technical Preview的最新 Windows HLK。 建議熟悉 Windows HLK。 若要下載並深入瞭解 Windows HLK,請參閱 Windows 硬體實驗室套件。
- 首先,在測試伺服器上安裝 HLK 控制器 (HLKC) 和 HLK Studio。 請勿將它安裝在叢集節點上。 系統管理員會使用此伺服器來執行測試及管理其他電腦。 HLKC 可用來同時管理多個叢集,因此可以使用已設定另一個叢集的現有 HLKC。
- 接下來,在下列專案上安裝 HLK 用戶端:
- 所有要用來作為儲存體叢集節點的伺服器, (個別 S2D 需求中也會描述的節點數目,至少應為四) ,
- 不屬於叢集的伺服器,作為測試控制器 (TC) 。 這是執行測試的位置。
- 所有用於測試 (的電腦,包括 HLK 控制器) 都應該加入相同的網域,而且擁有所有機器上具有系統管理員許可權的通用網域使用者。 此使用者的認證將會提供給測試架構,以執行測試。 使用者的密碼可能會傳輸並儲存為純文字。
- 所有叢集節點都必須在所有連線的網路介面上啟用 DHCP,並在連線的網路上設定 DHCP。
安裝程式
設定 HLK
如需如何安裝 HLK 的詳細指示,請參閱 HLK 使用者指南 以取得詳細指示。 在您安裝並設定所有電腦上的 HLK 之後,請建立電腦集區和專案:
- 在 HLKC 上的 HLK Studio 中,建立名稱可輕易識別叢集的新電腦集區,例如您稍後將使用的叢集名稱, (本檔使用「叢集」) 。 將 TC 和所有叢集節點新增至電腦集區。 請確定機器處於 [就緒 ] 狀態。
- 開啟HLK Studio,選取 [開始],然後選取 [所有應用程式] [Windows> Kits >HLK Studio]。
- 選取右上角的 [ 組態 ]。
- 以滑鼠右鍵按一下 $ (Root) ,然後選取 [ 建立電腦集區],然後指定名稱。 (本檔使用「叢集」。)
- 將您的機器移至新的集區。 HLK Studio 目前不支援多重選取專案,因此您必須一次移動一部機器。
- 選取集區中的所有機器,然後按一下滑鼠右鍵,然後選取 [變更電腦狀態>就緒]。 機器會先變更為 [初始化 ] 狀態。
- 確定機器達到 [就緒 ] 狀態。 HLK Studio 不會自動重新整理顯示的狀態。 等候幾秒鐘,然後選取 [預設 電腦集區]。 返回叢集電腦集區以重新整理電腦狀態。 所有機器都處於 就緒 狀態之後,請繼續建立專案。
- 建立具有相同名稱的新專案。
- 如果您是在 [ 組態 ] 檢視中,請按一下 [ 上一步 ] (它看起來像向左箭號) 標題 「Configuration」 的左側,以返回主要檢視。
- 在 [ 專案] 索引 標籤中,選取 [建立專案]。
- 將 「S2D」 指定為專案名稱。 不需要使用此確切名稱,但這麼做可讓您更輕鬆地識別專案。
準備機器以執行測試
此步驟會將必要的測試二進位檔和驅動程式部署到叢集節點和測試控制器,以便您可以執行 S2D 測試。 即使您多次執行實際的 S2D 測試,此測試作業也必須針對每個叢集執行一次。 此作業將會重新開機機器。
重要
在執行此測試作業之前,請確定所有用於測試的電腦上都停用安全開機和 BitLocker。 如果您使用測試控制器的虛擬機器,您可能需要手動停用安全開機和 BitLocker,因為預設可能會啟用它們。
有兩種方式可以執行 HLK 測試:
在未設定 S2D 的安裝程式上,也就是讓測試設定 S2D:
- 執行 S2D – 準備機器進行測試
- 執行 S2D – 設定儲存體叢集
- 執行 S2D – 基本驗證測試
- 執行 S2D – 壓力測試
在現有的 S2D 叢集上:
- 在布建的虛擬磁片) ,應該會有單一 256 GB 的磁片區 (,測試將會使用此磁片區。
- 對於 2 節點叢集,您必須有仲裁見證。
- 執行 S2D – 準備機器進行測試
- 執行 S2D – 基本驗證測試
- 執行 S2D – 壓力測試
在 HLK Studio中執行下列動作:
在 [ 專案] 索引 標籤中,按兩下您先前建立的專案,如果尚未選取) ,請 (。 選取專案名稱之後,專案名稱會顯示為檢視標題。
按一下 [ 選取範圍] 索引卷 標。
選取您先前建立的機器集區,其中包含叢集和測試控制器。
選取左側 的 [系統 ],然後檢查清單中出現的第一個叢集節點。
請確定只選取一個節點,而且您不小心選取測試控制器。
以滑鼠右鍵按一下選取的機器,然後選取 [ 新增/修改功能]。
在開啟的對話方塊中,從[裝置功能清單] 選取[System.Solutions.StorageSpacesDirect] 功能,然後選取 [確定]。
在 [ 測試 ] 索引標籤中,選取測試 S2D - 準備測試的電腦,然後選取 [ 執行選取]。
指定必要的參數。
- 針對 [網域]、[ 使用者名稱] 和 [ 密碼] 參數,針對具有電腦集區中所有機器之系統管理員存取權的網域使用者,輸入適當的資訊。
- 在 [ 角色 ] 下拉式清單中,應該選取 PrimaryNode 。 在電腦清單中,確認您已在 [ 選取範圍 ] 索引標籤中選取的節點已核取。 此外:
- 在 [角色] 下拉式清單中選取[TestController],然後從電腦清單中選取測試控制器。
- 在 [角色] 下拉式清單中選取[其他節點],然後選取叢集中的其餘節點。
- 在繼續之前,請確定已選取所有機器。
選取 [確定 ] 以執行作業。 這會準備機器。
進度列會出現在 HLK Studio 視窗底部。 當程式完成時,測試作業的 [ 狀態 ] 資料行中會出現綠色核取記號。 如果狀態改為顯示紅色 「X」,則測試作業失敗。 如需詳細資訊 ,請參閱疑難排解 。
此程式需要大約 10 分鐘的時間才能執行。 如果您的機器需要超過五分鐘才能重新開機,可能需要較長的時間。
建立叢集、存放集區和虛擬磁片
準備機器進行測試之後,您也必須設定 S2D,才能執行相關的測試。 下列作業會建立叢集、啟用 S2D,以及設定集區和空間。
重要
只有在 尚未 建立現有的叢集、存放集區或虛擬磁片時,此作業才會成功。 執行此作業之前,請先移除所有虛擬磁片、存放集區和叢集角色。 同時移除叢集本身。 如果您已經建立叢集、啟用 S2D 並設定並驗證集區和空間,請略過此步驟,並繼續執行測試。
在 HLK Studio 的 [ 測試 ] 索引標籤中,選取 [測試 S2D - 設定儲存體叢集 並 執行選取],然後指定必要的參數和角色。
- 針對 ClusterName參數,輸入您想要建立為其值的叢集名稱。 (您必須為稍後的測試提供相同的叢集名稱。)
- 如果靜態 IP 位址指派給叢集,您也可以在 [ClusterStaticIP ] 欄位中輸入 IP 位址。 否則,請將此參數保留空白。 位址會指派給叢集名稱。
- 除非您另有指示,否則將其他參數保留空白。
- 在 [ 角色 ] 下拉式清單中,應該選取 PrimaryNode 。 在電腦清單中,確認您已在 [ 選取範圍 ] 索引標籤中選取的節點已核取。 此外:
- 在 [角色] 下拉式清單中選取[TestController],然後從電腦清單中選取測試控制器。
- 在 [角色] 下拉式清單中選取[其他節點],然後在電腦清單中選取叢集中的其他節點。
- 在繼續之前,請確定已選取所有機器。
選取 [確定 ] 以執行作業。 這會建立叢集並設定 S2D。
進度列會出現在 HLK Studio 視窗底部。 當程式完成時,測試作業的 [ 狀態 ] 資料行中會出現綠色核取記號。 如果狀態改為顯示紅色 「X」,則測試作業失敗。 如需詳細資訊 ,請參閱疑難排解 。
此作業大約需要 15 分鐘才能完成。 如果您的機器需要五分鐘以上的時間來重新開機,或如果您有大量的磁片,則可能需要較長的時間。
執行測試
(BVT) 執行基本驗證測試
BVT 會執行兩種類型的測試:
- 一種測試類型會在執行隨機寫入 I/O 時,將叢集共用磁片區 (CSV) 在節點之間移動儲存空間直接存取。 它也會確認 I/O 未中斷,且 CSV 不會失敗。
- 另一種測試類型會停止叢集服務、終止叢集服務、收回節點、正常重新開機機器,以及不正常地重新開機機器,以降低節點。 (每個動作都會以隨機 node 為目標。) 它也會在節點失敗期間執行以適當 CSV 為目標的隨機寫入 I/O,並確認 I/O 不會失敗。
若要在 HLK 中執行這些測試:
在 [ 測試 ] 索引標籤中,選取測試 S2D - 基本驗證測試 並 選取 [執行],然後輸入必要的參數:
- 針對 ClusterName參數,輸入叢集的名稱。 它應該與您稍早提供的名稱相同,才能設定叢集。
- 除非您另有指示,否則請勿變更或填入其他參數。
- 在 [ 角色 ] 下拉式清單中,應該選取 PrimaryNode 。 在下方的電腦清單中,確認已核取您在 [ 選取範圍 ] 索引標籤中選取的節點。 此外:
- 在 [角色] 下拉式清單中選取[TestController],然後從電腦清單中選取測試控制器。
- 在 [角色] 下拉式清單中選取[其他節點],然後選取叢集中的其餘節點。
- 在繼續之前,請確定已選取所有機器。
選取 [確定 ] 以啟動作業。 這會執行 BVT。
進度列會出現在 HLK Studio 視窗底部。 當程式完成時,測試作業的 [ 狀態 ] 資料行中會出現綠色核取記號。 如果狀態改為顯示紅色 「X」,則測試作業失敗。 如需詳細資訊 ,請參閱疑難排解 。
此作業通常需要 30 到 60 分鐘才能執行。 針對預覽版本,BVT 的預期通過率至少為 80%。
執行壓力測試
壓力測試會停止或終止叢集服務) ,造成重複和隨機節點失敗 (。 如果組態容許該節點,它們可能會造成多個節點失敗。 在節點失敗期間,測試會從以適當 CSV 為目標的多個節點執行多個 I/O 資料流程。 (每個資料流程都會使用讀取資料驗證執行循序/隨機讀取/寫入。)
若要執行下列測試:
在HLK Studio的 [測試] 索引標籤中,選取測試S2D - 壓力測試並選取 [執行],然後輸入必要的參數:
- 針對 ClusterName參數,輸入叢集的名稱。 它應該與您稍早提供的名稱相同,才能設定叢集。
- 除非您另有指示,否則請勿變更或填入其他參數。
- 在 [ 角色 ] 下拉式清單中,應該選取 PrimaryNode 。 在電腦下方的清單中,確認已核取您在 [ 選取範圍 ] 索引標籤中選取的節點。 此外:
- 在 [角色] 下拉式清單中選取[TestController],然後從電腦清單中選取測試控制器。
- 在 [角色] 下拉式清單中選取[其他節點],然後選取叢集中的其餘節點。
- 在繼續之前,請確定已選取所有機器。
選取 [確定 ] 以執行作業。 這會執行壓力測試。
進度列會出現在 HLK Studio 視窗底部。 當程式完成時,測試作業的 [ 狀態 ] 資料行中會出現綠色核取記號。 如果狀態改為顯示紅色 「X」,則測試作業失敗。 如需詳細資訊 ,請參閱疑難排解 。
對於預覽版本,壓力測試的預期通過率至少為 60%。 此測試作業通常需要 45 分鐘到一小時的時間,才能使用預設參數來執行。 不過,使用預設參數傳遞一次之後,建議您藉由為 TestRunTime提供較大的值,以較長的執行時間再次執行它。 (這會指定以秒為單位的核心執行時間;作業通常會因為測試設定和清除而執行 15 到 30 分鐘。) 此作業支援最多 24 小時的執行時間。
疑難排解
如果作業或測試失敗,您可以檢查適當的記錄,以探索失敗的原因。 如果您需要,您可以將記錄轉送給適當的人員,以協助調查。 這些檔會參考每個作業的執行 結果。
取得測試記錄
當您位於執行測試的相同 S2D 專案中時,請在HLK Studio中選取 [結果] 索引標籤。
選取測試名稱左邊的三角形,展開您要進行疑難排解的測試。
如果您已多次執行測試,就會顯示多個結果。 每個結果都會顯示時間戳記,並識別其執行所在的電腦。 以滑鼠右鍵按一下您要進行疑難排解的結果,然後選取 [其他檔案>全部顯示]。 這會在包含測試記錄和相關記錄的檔案總管中開啟視窗。
測試記錄的檔案名開頭為 「TST-」。如果在測試作業中執行多個測試工作,可能會有多個測試記錄檔。 例如,BVT 可能會有一個測試工作執行移動 CSV,而另一個會執行儲存體縮放單位 (SSU) 失敗。 (由於直接連結的儲存體拓撲,每個節點及其儲存體都會被視為一個 SSU.) 變化名稱位於檔案名 (,以及儲存空間直接存取) 的程式碼名稱。
如果有多個測試記錄檔,若要快速查看哪些工作失敗,請先展開結果,使其工作出現。 然後,您可以尋找顯示紅色 「X」 的工作。
在上述範例中,工作的圖示表示 驗證 IO 與 CSV 移動 失敗, (它只會顯示紅色 「X」) 。 它們也會指出未執行 驗證 SSU 失敗的 IO ,而是在 (顯示紅色 X 的弧形箭號,) 因為先前失敗而略過。
在文字編輯器中開啟測試記錄檔之後,請搜尋 「SEV2」,以查看測試是否失敗,如果是,原因為何。 在下列範例中,您可以看到空間在機架復原之後未處於狀況良好的狀態。 如需此失敗的其他詳細資料,請參閱 常見的已知問題。
1940.1404 2015/01/09-16:36:14.867 [INFO] 0 : [TST]Space ID: 19CFCDFCC19EB54AAA780436B2B1D859 集區識別碼:5D12DF6A5D4DB444AA3407AFA5749578 易記名稱:TestSpace 是否手動附加? 是叢集嗎? 是復原類型:2 布建類型:2 個複本數目:3 個數據行數目:1 個容錯:2 健全狀況:1 個 (警告) 狀態:11 (InService/Regenerating) 在節點上附加:RR1FSC2623N05-1 節點上可見:RR1FSC2623N05-1 RR1FSC2623N05-2 RR1FSC2623N28-1 RR1FSC2623N28-2 此空間所使用的磁片磁碟機:[base\cluster\testsrc\common\storagewrapper\swvirtualdisk.cpp@66: ctsw::SWVirtualDisk::QuerySpInfo () ] [orchestrator.cpp@192]
錯誤:1940.1404 2015/01/09-16:36:14.867 [ SEV2] 0 : [TST]Status=-2147418113 (8000FFFFH) 'AtivebriaBVT::VerifyIOWith一律執行資源部署後,空間未處於狀況良好的狀態。 [base\cluster\testsrc\releasebria\bribriabvt\calabriabvt.cpp@1359一個Calabriabvt.cpp@1359,BriaBVT::VerifyIOWith一區區Failure () ][calabriabvt.cpp@1379]
1940.1404 2015/01/09-16:36:14.867 [INFO] 0 : [TST] 錯誤訊息2147549183 (0x8000ffff) :重大失敗 [wttlog.cpp@1237]
錯誤:TAEF:'TerminateOnFirstFailure' 集合 - 忽略下列所有測試,並嘗試正常終止。
EndGroup:一般資源庫BVT::VerifyIOWith一般 [Failed]
錯誤:1940.1404 2015/01/09-16:36:14.867 [SEV2] 0 : [TST]Status=-2147418113 (8000FFFFH) 'PowerbriaBVT::VerifyIOWith已啟動][布建][Ilure] - 非預期的行為: 機架復原後空間未處於狀況良好的狀態。 [base\cluster\testsrc\releasebria\bribriabvt\calabriabvt.cpp@1359一個Calabriabvt.cpp@1359,BriaBVT::VerifyIOWith一區區Failure () ][calabriabvt.cpp@1379]
此問題壓力測試的範例輸出:
1148.035C 2015/01/12-14:41:10.489 [INFO] 0 : [TST]等候所有空間變成狀況良好。Space 19CFCDFCC19EB54AAA780436B2B1D859 狀態為 InService/Regenerating [calabriastress.cpp@938]
錯誤:1148.035C 2015/01/12-14:41:10.489 [SEV2] 0 : [TST]Status=258 (102H) 失敗驗證:並非所有空間在逾時 1200000 毫秒 內達到狀況良好的狀態 。 可能會繼續等候,直到等候逾時為止。 [calabriastress.cpp@962]
1148.035C 2015/01/12-14:41:10.505 [INFO] 0 : [TST] 錯誤 258 (0x102) :等候作業逾時。[wttlog.cpp@1237]
取得叢集和儲存體診斷記錄
若要取得失敗結果的叢集和儲存體診斷記錄:
展開失敗的結果,使其測試工作顯示。
以滑鼠右鍵按一下[RunJob-Generate] 叢集和儲存體診斷記錄的工作,然後選取 [工作記錄>顯示全部]。 這會在包含叢集和儲存體診斷記錄的檔案總管中開啟視窗。 這些記錄可以提供測試失敗原因的其他詳細資料。
將記錄傳送至 Microsoft 以進行測試失敗分析
如果您需要將記錄傳送給 Microsoft,以取得測試失敗分析的說明,請參閱 封裝結果 一節以取得建立 的步驟。HLKX 結果套件。 此套件將包含測試所產生的相關記錄並收集,並有助於分析失敗。
常見的已知問題
測試失敗最常見的原因是在節點或節點關閉並復原之後,一或多個空間需要太長的時間重新產生資料 (在服務/重新產生狀態) 。 不平均的儲存體效能可能會導致重新產生超過逾時,並導致測試失敗。 如果您經常看到此問題,您的設定可能會有效能瓶頸。 如果是這種情況,建議您檢查您的儲存體、網路效能和遠端直接記憶體存取, (RDMA) 。
此問題的 BVT 輸出範例:
1940.1404 2015/01/09-16:36:14.867 [INFO] 0 : [TST]Space ID: 19CFCDFCC19EB54AAA780436B2B1D859 集區識別碼:5D12DF6A5D4DB444AA3407AFA5749578 易記名稱:TestSpace 是否手動附加? 是叢集嗎? 是復原類型:2 布建類型:2 個複本數目:3 個數據行數目:1 個容錯:2 健全狀況:1 個 (警告) 狀態:11 (InService/Regenerating) 附加在節點上:RR1FSC2623N05-1 節點上可見:RR1FSC2623N05-1 RR1FSC2623N05-2 RR1FSC2623N28-1 RR1FSC2623N28-2 此空間所使用的磁片磁碟機:[base\cluster\testsrc\common\storagewrapper\swvirtualdisk.cpp@66: ctsw::SWVirtualDisk::QuerySpInfo () ] [orchestrator.cpp@192]
錯誤:1940.1404 2015/01/09-16:36:14.867 [SEV2] 0 : [TST]Status=-2147418113 (8000FFFFH) 'PowerbriaBVT::VerifyIOWith已啟動][布建][Ilure] - 非預期的行為: 機架復原後空間未處於狀況良好的狀態。 [base\cluster\testsrc\releasebria\bribriabvt\calabriabvt.cpp@1359一個Calabriabvt.cpp@1359,BriaBVT::VerifyIOWith一區區Failure () ][calabriabvt.cpp@1379]
此問題壓力測試的範例輸出:
1148.035C 2015/01/12-14:41:10.489 [INFO] 0 : [TST]等候所有空間變成狀況良好。Space 19CFCDFCC19EB54AAA780436B2B1D859 狀態為 InService/Regenerating [calabriastress.cpp@938]
錯誤:1148.035C 2015/01/12-14:41:10.489 [SEV2] 0 : [TST]Status=258 (102H) 失敗驗證:並非所有空間在逾時 1200000 毫秒 內達到狀況良好的狀態 。 可能會繼續等候,直到等候逾時為止。 [calabriastress.cpp@962]
1148.035C 2015/01/12-14:41:10.505 [INFO] 0 : [TST] 錯誤 258 (0x102) :等候作業逾時。[wttlog.cpp@1237]
封裝結果
在所有測試都成功完成之後,當您仍在 HLK Studio的相同專案中時,請選取 [ 套件 ] 索引標籤,然後在右下角建立 套件 。 當系統提示您輸入 [簽署選項] 時,請選取 [不要簽署]。 將結果儲存至檔案。 此檔案必須包含在任何 S2D 認證提交中。
詞彙
詞彙 | 描述 |
---|---|
Bvt | 基本驗證測試 |
CSV | 叢集共用磁碟區 |
Das | 直接連結存放裝置 |
HCK | (Windows) 硬體認證套件,先前用於認證測試的套件 |
HLK | (Windows) Hardware Lab Kit,這是用來協助驗證 Windows 硬體設定的測試架構。 它也會用來執行本主題中所述的測試。 |
HLKC | HLK 控制器,系統管理員用來執行測試和管理其他電腦的伺服器。 這不可以是叢集的一部分。 |
TC | 測試控制器,這是一些測試要以叢集為目標的伺服器。 這不可以是叢集的一部分。 |
S2D | 儲存空間直接存取 |