管理 Azure Stack Hub 的記憶體基礎結構
本文說明 Azure Stack Hub 記憶體基礎結構資源的健全狀況和作業狀態。 這些資源包括磁碟驅動器和磁碟區。 本主題中的資訊可協助您針對各種問題進行疑難解答,例如當磁碟驅動器無法新增至集區時。
音量狀態
若要了解磁碟區的狀態,請使用下列 PowerShell 命令:
$scaleunit_name = (Get-AzsScaleUnit)[0].name
$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name
Get-AzsVolume -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object VolumeLabel, HealthStatus, OperationalStatus, RepairStatus, Description, Action, TotalCapacityGB, RemainingCapacityGB
以下是輸出範例,其中顯示卸載的磁碟區和受損/不完整的磁碟區:
VolumeLabel | 健康狀態 | OperationalStatus |
---|---|---|
ObjStore_1 | 未知 | 超然 |
ObjStore_2 | 警告 | {已降級,不完整} |
下列各節列出健康和操作狀態:
磁碟區健康情況狀態:狀況良好
作業狀態 | 描述 |
---|---|
還行 | 磁碟區狀況良好。 |
欠佳 | 數據不會均勻寫入硬碟。 動作: 連絡支持人員,以優化存放集區中的磁碟驅動器使用量。 在進行之前,請使用 https://aka.ms/azurestacklogfiles中的指引來啟動記錄檔收集程式。 還原失敗的連線之後,您可能必須從備份還原。 |
磁碟區健康狀態:警告
當磁碟區處於警告狀態時,這表示有一或多個資料副本無法存取,但 Azure Stack Hub 仍可讀取至少一份資料。
作業狀態 | 描述 |
---|---|
服務中 | Azure Stack Hub 正在修復磁碟區,像是新增或移除磁碟之後。 修復完成時,磁碟區應該會恢復到正常健康狀態。 動作: 等候 Azure Stack Hub 完成修復磁碟區,並在之後檢查狀態。 |
不完全的 | 磁碟區的復原能力會降低,因為一或多個磁碟驅動器失敗或遺失。 不過,遺失的硬碟包含標記為 up-to日期的資料複本。 動作: 重新連線任何遺失的磁碟驅動器、取代任何失敗的磁碟驅動器,以及讓任何離線的伺服器上線。 |
退化 | 磁碟區的復原能力會因為一或多個磁碟驅動器失敗或遺失,以及磁碟驅動器上的過時數據復本而減少。 動作: 重新連線任何遺失的磁碟驅動器、取代任何失敗的磁碟驅動器,以及讓任何離線的伺服器上線。 |
磁碟區健康狀態:不健康
當磁碟區處於狀況不良的健康狀態時,磁碟區上的部分或所有數據目前無法存取。
作業狀態 | 描述 |
---|---|
沒有冗餘 | 磁碟區因為太多磁碟驅動器故障而損失資料。 動作: 聯絡支援人員。 在進行之前,請使用 https://aka.ms/azurestacklogfiles中的指引來啟動記錄檔收集程式。 |
磁碟區健康情況狀態:未知
如果虛擬磁碟已被卸載,磁碟區可能處於未知健康狀態。
作業狀態 | 描述 |
---|---|
冷漠 | 發生儲存裝置故障,可能會導致容量無法訪問。 某些數據可能會遺失。 動作: 1.檢查所有存儲設備的實體和網路連線能力。 2.如果所有裝置都已正確連線,請連絡支持人員。 在進行之前,請使用 https://aka.ms/azurestacklogfiles中的指引來啟動記錄檔收集程式。 連線恢復失敗後,您可能需要從備份中還原。 |
磁碟驅動器狀態
使用下列 PowerShell 命令來監視磁碟驅動器的狀態:
$scaleunit_name = (Get-AzsScaleUnit)[0].name
$subsystem_name = (Get-AzsStorageSubSystem -ScaleUnit $scaleunit_name)[0].name
Get-AzsDrive -ScaleUnit $scaleunit_name -StorageSubSystem $subsystem_name | Select-Object StorageNode, PhysicalLocation, HealthStatus, OperationalStatus, Description, Action, Usage, CanPool, CannotPoolReason, SerialNumber, Model, MediaType, CapacityGB
下列各節說明磁碟驅動器可以處於的健康狀態:
磁碟驅動器健全狀態:狀況良好
作業狀態 | 描述 |
---|---|
還行 | 磁碟區狀況良好。 |
服務中 | 硬碟正在執行一些內部維護作業。 動作完成時,磁碟驅動器應該會回到 [良好] 狀態。 |
磁碟驅動器健全狀況狀態:警告
處於警告狀態的磁碟驅動器可以成功讀取和寫入數據,但發生問題。
作業狀態 | 描述 |
---|---|
通訊遺失 | 與磁碟驅動器的連線已中斷。 動作: 讓所有伺服器重新上線。 如果這未修正,請重新連線磁碟驅動器。 如果此狀態持續存在,請取代磁碟驅動器以確保完整的復原能力。 |
預測失敗 | 預計驅動器即將發生故障。 動作: 儘快取代磁碟驅動器,以確保完整的復原能力。 |
IO 錯誤 | 存取磁碟驅動器時發生暫時錯誤。 動作: 如果此狀態持續存在,請取代磁碟驅動器以確保完整復原能力。 |
暫時性錯誤 | 磁碟驅動器發生暫時錯誤。 此錯誤通常表示磁碟驅動器沒有回應,但也可能表示儲存空間直接存取保護磁碟分區未適當地從磁碟驅動器中移除。 動作: 如果此狀態持續存在,請取代磁碟驅動器以確保完整復原能力。 |
異常延遲 | 磁碟驅動器有時沒有回應,並顯示失敗的跡象。 動作: 如果此狀態持續存在,請取代磁碟驅動器以確保完整復原能力。 |
從集區移除 | Azure Stack Hub 正在從其存放集區中移除磁碟驅動器。 動作: 等候 Azure Stack Hub 完成移除磁碟驅動器,然後檢查狀態。 如果狀態維持不變,請連絡支持人員。 在進行之前,請使用 https://aka.ms/azurestacklogfiles中的指引來啟動記錄檔收集程式。 |
啟動維護模式 | Azure Stack Hub 正在將磁碟驅動器置於維護模式。 此狀態是暫時的,磁碟驅動器應該很快就會處於維護模式狀態。 動作: 等候 Azure Stack Hub 完成程式,然後檢查狀態。 |
在維護模式中 | 磁碟驅動器處於維護模式,會停止磁碟驅動器的讀取和寫入。 此狀態通常表示 Azure Stack Hub 管理工作,例如 PNU 或 FRU,正在操作磁碟驅動器。 但系統管理員也可以將磁碟驅動器置於維護模式中。 動作: 等候中樞 Azure Stack Hub 完成系統管理工作,然後檢查狀態。 如果狀態維持不變,請連絡支持人員。 在進行之前,請使用 https://aka.ms/azurestacklogfiles中的指引來啟動記錄檔收集程式。 |
停止維護模式 | Azure Stack Hub 正在讓磁碟驅動器重新上線。 此狀態為暫時性 - 磁碟驅動器應該很快就會處於另一個狀態,在理想情況下狀況良好。 動作: 等候 Azure Stack Hub 完成程式,然後檢查狀態。 |
磁碟驅動器健全狀態:狀況不良
處於不良狀態的磁碟目前無法寫入或存取。
作業狀態 | 描述 |
---|---|
分裂 | 磁碟驅動器已與集區分開。 動作: 以新的磁碟替換磁碟。 如果您必須使用此磁碟,請從系統移除磁碟,確定磁碟上沒有有用的數據、清除磁碟,然後重新插入磁碟。 |
無法使用 | 實體磁碟已隔離,因為解決方案廠商不支援此實體磁碟。 僅支援已針對解決方案核准且具有正確磁碟韌體的磁碟。 動作: 將磁碟驅動器取代為解決方案的已核准製造商和型號號碼的磁碟。 |
過時元數據 | 取代磁碟先前已使用,且可能包含來自未知記憶體系統的數據。 磁碟已隔離。 動作: 用新的磁碟替換舊的磁碟。 如果您必須使用此磁碟,請從系統移除磁碟,確定磁碟上沒有有用的數據、清除磁碟,然後重新插入磁碟。 |
無法辨識的元數據 | 在磁碟驅動器上找到無法辨識的元數據,這通常表示該磁碟驅動器包含來自不同集區的元數據。 行動: 以新的磁碟更換原有的磁碟。 如果您必須使用此磁碟,請從系統移除磁碟,確定磁碟上沒有有用的數據、清除磁碟,然後重新插入磁碟。 |
失敗的媒體 | 磁碟驅動器失敗,且不再由儲存空間使用。 動作: 儘快取代磁碟驅動器,以確保完整的韌性。 |
裝置硬體故障 | 此磁碟驅動器發生硬體故障。 動作: 儘快更換磁碟,以確保完全的韌性。 |
更新韌體 | Azure Stack Hub 正在更新磁碟驅動器上的韌體。 此狀態是暫時的,通常持續不到一分鐘,而在此期間,集區中的其他磁碟驅動器會處理所有讀取和寫入。 動作: 等候 Azure Stack Hub 完成更新,並在之後檢查狀態。 |
開始 | 驅動器正在準備運行。 此狀態應該是暫時的——一旦完成,硬碟應該轉換為不同的操作狀態。 動作: 等候 Azure Stack Hub 完成作業,並在之後檢查狀態。 |
磁碟驅動器無法集區的原因
某些磁碟尚未準備好進入 Azure Stack Hub 儲存集區。 您可以查看磁碟驅動器的 CannotPoolReason
屬性,找出磁碟驅動器為何不符合集區資格。 下表提供每個原因的詳細數據。
原因 | 描述 |
---|---|
硬體不符合規範 | 磁碟驅動器未出現在健康服務指定的已核准儲存模型清單中。 動作: 以新的磁碟取代舊的磁碟。 |
韌體不符合規範 | 實體磁碟驅動器上的韌體不在健康服務所核准的韌體修訂清單中。 操作: 將驅動器替換為新的硬碟。 |
由叢集使用中 | 故障轉移叢集正在使用這個磁碟。 動作: 以新的磁碟替換磁碟片。 |
卸除式媒體 | 磁碟驅動器被分類為可移除磁碟驅動器。 動作: 以新的磁碟取代舊的磁碟。 |
狀況不良 | 磁碟驅動器未處於狀況良好狀態,可能需要更換。 動作: 用新的磁碟替換舊的磁碟。 |
容量不足 | 磁碟分區佔用磁碟驅動器上的可用空間。 動作: 以新的磁碟取代現有的磁碟。 如果您必須使用此磁碟,請從系統移除磁碟,確定磁碟上沒有有用的數據、清除磁碟,然後重新插入磁碟。 |
進行中的驗證 | 健康服務正在確認驅動器或其韌體是否已獲核准可以使用。 動作: 等候 Azure Stack Hub 完成程式,然後檢查狀態。 |
驗證失敗 | 健康情況服務無法檢查磁碟驅動器或磁碟驅動器上的韌體是否已獲得核准以供使用。 動作: 聯絡支援。 在進行之前,請使用 https://aka.ms/azurestacklogfiles中的指引來啟動記錄檔收集程式。 |
離線 | 磁碟驅動器已離線。 動作: 連絡客服人員。 在進行之前,請使用 https://aka.ms/azurestacklogfiles中的指引來啟動記錄檔收集程式。 |