檢視 Azure Stack HCI 2405.2 版本中的已知問題
適用於:Azure 本機版本 23H2
本文會識別 Azure Stack HCI 2405.2 版本中的重要已知問題及其因應措施。
版本資訊會持續更新,並在發現需要提出因應措施的重大問題時有所增補。 部署 Azure Stack HCI 之前,請先仔細檢閱版本資訊中包含的資訊。
重要
如需此版本支援的更新路徑資訊,請參閱 發行資訊。
如需此版本中新功能的詳細資訊,請參閱 23H2 的新功能。
2405.2 版的問題
此軟體版本對應至軟體版本號碼 2405.2.7。
此版本的版本資訊包括此版本中已修正的問題、此版本中的已知問題,以及舊版所傳出的版本注意事項問題。
已修正的問題
以下是此版本中的修正問題:
功能 | 問題 | 因應措施/註解 |
---|---|---|
更新 | 在此版本中,已修正與健康狀態檢查中遺漏資源類型標識符字段相關的更新問題。 | |
更新 | 在此版本中,已修正與名稱相同之不同健康狀態檢查相關的更新問題。 | |
更新 | 在此版本中,已修正解決方案產生器延伸模組更新健康情況檢查在更新前或每日健康情況檢查中遺漏的問題。 | |
更新 | 在此版本中,已修正因更新服務損毀而無法檢視或啟動新更新的問題。 | |
更新 | 在此版本中,已改善更新服務,以防止叢集上的動作泛濫。 | |
更新 | 在此版本中,已新增健康情況檢查,以防止新增或移除伺服器時更新失敗。 | |
Arc VM 管理 | 在舊版中,VM 的任何電源狀態變更作業,例如啟動停止、儲存和暫停,一開始都會傳回 VM 的狀態為執行中,最後在重新整理 30+ 秒后顯示正確的狀態。 在此版本中,電源狀態變更作業只會在 VM 狀態變更為預期的狀態之後傳回。 |
此版本已知的問題
功能 | 問題 | 因應措施 |
---|---|---|
更新 | 由於 SDN 基礎結構 VM 中的錯誤,一旦主機經過秘密輪替和更新,SDN 就會停止運作。 | 此版本中沒有此問題的因應措施。 如果發生此問題,請連絡 Microsoft 支援服務 以取得後續步驟。 |
更新 | 由於環境整備檢查程序發生錯誤,實體磁碟環境整備檢查錯誤失敗並封鎖更新。 | 請等候幾分鐘,然後重試更新。 |
部署 | 在此版本中,您可能會收到下列錯誤: 使用 叫用雲端部署失敗 - 值不可以是 Null。 | 此版本中沒有此問題的因應措施。 如果發生此問題,請連絡 Microsoft 支援服務 以取得後續步驟。 |
更新 | 在此版本中,環境檢查失敗,並出現下列錯誤: Update 處於失敗狀態:HealthCheckFailed。ECE 的摘要 XML 不存在。 | 此版本中沒有此問題的因應措施。 如果發生此問題,請連絡 Microsoft 支援服務 以取得後續步驟。 |
先前版本的已知問題
以下是舊版的已知問題:
功能 | 問題 | 因應措施 | ||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
更新 | 透過 Azure 更新管理員檢視 Azure Stack HCI 叢集的整備檢查結果時,可能會有多個具有相同名稱的整備檢查。 | 此版本中沒有已知的因應措施。 選取 [ 檢視詳細資料 ] 以檢視整備檢查的特定資訊。 | ||||||||||||||||||
Arc VM 管理 | 在大型部署案例中,例如大量AVD主機集區部署或大規模VM布建,您可能會遇到 Hyper-V 套接字外部連結庫問題所造成的可靠性問題。 | 請遵循下列步驟來減輕問題: 1.執行 命令 Get-service mochostagent (\) get-process (\) kill 。 檢查命令的輸出,並確認句柄計數是否在數千個中。 2.執行 命令 Get-service mochostagent (\) get-process 以終止進程。 3.執行 命令 restart-service mochostagent 以重新啟動mochostagent服務。 |
||||||||||||||||||
部署 | 透過 Azure 入口網站 部署 Azure Stack HCI 版本 23H2 時,可能會遇到下列部署驗證失敗:Could not complete the operation. 400: Resource creation validation failed. Details: [{"Code":"AnswerFileValidationFailed","Message":"Errors in Value Validation:\r\nPhysicalNodesValidator found error at deploymentdata.physicalnodes[0].ipv4address: The specified for \u0027deploymentdata.physicalnodes[0].ipv4address\u0027 is not a valid IPv4 address. Example: 192.168.0.1 or 192.168.0.1","Target":null,"Details":null}]. 如果您在 Azure 入口網站 部署中移至 [網络] 索引標籤,在 [網络意圖] 設定內,您可能會看到下列錯誤:選取的實體網路適配器未繫結至管理虛擬交換器。 |
請遵循針對部署驗證失敗進行疑難解答中的程式,Azure 入口網站。 | ||||||||||||||||||
部署 | 透過 Azure 入口網站 部署失敗,並出現此錯誤:無法從密鑰保存庫擷取秘密 LocalAdminCredential。 | 此版本中沒有此問題的因應措施。 如果發生此問題,請連絡 Microsoft 支援服務 以取得後續步驟。 | ||||||||||||||||||
部署 | 在某些情況下,在 Azure Stack HCI 伺服器的註冊期間,可能會在偵錯記錄中看到此錯誤: 發生內部伺服器錯誤。 可能未安裝裝置部署的其中一個強制擴充功能。 | 請遵循下列步驟來減輕問題:$Settings = @{ "CloudName" = $Cloud; "RegionName" = $Region; "DeviceType" = "AzureEdge" } New-AzConnectedMachineExtension -Name "AzureEdgeTelemetryAndDiagnostics" -ResourceGroupName $ResourceGroup -MachineName $env:COMPUTERNAME -Location $Region -Publisher "Microsoft.AzureStack.Observability" -Settings $Settings -ExtensionType "TelemetryAndDiagnostics" -EnableAutomaticUpgrade New-AzConnectedMachineExtension -Name "AzureEdgeDeviceManagement" -ResourceGroupName $ResourceGroup -MachineName $env:COMPUTERNAME -Location $Region -Publisher "Microsoft.Edge" -ExtensionType "DeviceManagementExtension" New-AzConnectedMachineExtension -Name "AzureEdgeLifecycleManager" -ResourceGroupName $ResourceGroup -MachineName $env:COMPUTERNAME -Location $Region -Publisher "Microsoft.AzureStack.Orchestration" -ExtensionType "LcmController" New-AzConnectedMachineExtension -Name "AzureEdgeRemoteSupport" -ResourceGroupName $ResourceGroup -MachineName $env:COMPUTERNAME -Location $Region -Publisher "Microsoft.AzureStack.Observability" -ExtensionType "EdgeRemoteSupport" -EnableAutomaticUpgrade |
||||||||||||||||||
更新 | 當 Azure 入口網站 錯誤地回報更新狀態時,此版本中發生間歇性問題,因為更新已完成或進行中。 | 透過遠端 PowerShell 工作話連線到您的 Azure 本機 。 若要確認更新狀態,請執行下列 PowerShell Cmdlet:$Update = get-solutionupdate | ? version -eq "<version string>" 將版本字串取代為您執行的版本。 例如,“10.2405.0.23”。 $Update.state 如果更新狀態為 [已安裝],則您不需要採取進一步的動作。 Azure 入口網站 24 小時內正確重新整理狀態。 若要更快重新整理狀態,請遵循其中一個叢集節點上的這些步驟。 重新啟動雲端管理叢集群組。 Stop-ClusterGroup "Cloud Management" Start-ClusterGroup "Cloud Management" |
||||||||||||||||||
更新 | 在初始MOC更新期間,因為目錄快取中找不到目標MOC版本,所以會發生失敗。 後續更新和重試會在目標版本中顯示MOC,而沒有更新成功,因此Arc Resource Bridge 更新會失敗。 若要驗證此問題,請使用 針對 Azure Stack HCI 版本 23H2 的解決方案更新進行疑難解答,收集更新記錄。 記錄檔應該會顯示類似的錯誤訊息(目前版本在錯誤訊息中可能不同): [ERROR: { "errorCode": "InvalidEntityError", "errorResponse": "{\n\"message\": \"the cloud fabric (MOC) is currently at version v0.13.1. A minimum version of 0.15.0 is required for compatibility\"\n}" }] |
請遵循下列步驟來減輕問題: 1.若要尋找 MOC 代理程式版本,請執行下列命令: 'C:\Program Files\AksHci\wssdcloudagent.exe' version 。2.使用 命令的輸出,從下表中尋找符合代理程式版本的MOC版本,並設定 $initialMocVersion 為該MOC版本。 $targetMocVersion 尋找您要更新的 Azure Stack HCI 組建,並從下表取得相符的 MOC 版本來設定 。 在以下提供的風險降低文稿中使用這些值:
例如,如果代理程式版本是 v0.13.0-6-gf13a73f7,v0.11.0-alpha.38,01/06/2024,則 $initialMocVersion = “1.0.24.10106” 如果您要更新為 2405.0.23,則 $targetMocVersion = “1.3.0.10418” 為 。3.在第一個節點上執行下列 PowerShell 命令: $initialMocVersion = "<initial version determined from step 2>" $targetMocVersion = "<target version determined from step 2>" # 匯入MOC模組兩次 import-module moc import-module moc $verbosePreference = "Continue" # 清除 SFS 目錄快取 Remove-Item (Get-MocConfig).manifestCache # 將版本設定為更新之前的目前MOC版本,並將狀態設定為更新失敗 Set-MocConfigValue -name "version" -value $initialMocVersion Set-MocConfigValue -name "installState" -value ([InstallState]::UpdateFailed) # 將MOC更新重新執行至所需的版本 Update-Moc -version $targetMocVersion 4.繼續更新。 |
||||||||||||||||||
HCI 上的 AKS | AKS 叢集建立失敗, Error: Invalid AKS network resource id 並出現 。 當相關聯的邏輯網路名稱有底線時,就會發生此問題。 |
邏輯網路名稱不支援底線。 請務必不要在 Azure Stack HCI 上部署的邏輯網路名稱中使用底線。 | ||||||||||||||||||
修復伺服器 | 在罕見的情況下, Repair-Server 作業會失敗併 HealthServiceWaitForDriveFW 發生錯誤。 在這些情況下,不會移除已修復節點的舊磁碟驅動器,而且新磁碟會卡在維護模式中。 |
若要避免此問題,請確定您不要透過 Windows Admin Center 或使用 Suspend-ClusterNode -Drain PowerShell Cmdlet 來清空節點,再啟動 Repair-Server 。 如果發生此問題,請連絡 Microsoft 支援服務 以取得後續步驟。 |
||||||||||||||||||
修復伺服器 | 當單一伺服器 Azure Stack HCI 從 2311 更新至 2402,然後 Repair-Server 執行 時,就會發生此問題。 修復作業失敗。 |
修復單一節點之前,請遵循下列步驟: 1.針對 ADPrepTool 執行版本 2402。 請遵循準備Active Directory中的步驟。 此動作很快,並將必要的許可權新增至組織單位 (OU)。 2.將計算機物件從 計算機 區段移至根 OU。 執行以下命令: Get-ADComputer <HOSTNAME> | Move-ADObject -TargetPath "<OU path>" |
||||||||||||||||||
部署 | 如果您自行準備 Active Directory(不使用Microsoft提供的腳本和程式),您的 Active Directory 驗證可能會因為缺少 Generic All 許可權而失敗。 這是因為驗證檢查中檢查是否有針對的專用許可權專案 msFVE-RecoverInformationobjects – General – Permissions Full control ,這是 BitLocker 復原的必要專案。 |
使用 Prepare AD 文稿方法,或使用您自己的方法,請務必指派特定權限 msFVE-RecoverInformationobjects – General – Permissions Full control 。 |
||||||||||||||||||
部署 | 此版本中罕見的問題,其中 DNS 記錄會在 Azure Stack HCI 部署期間遭到刪除。 發生這種情況時,會看到下列例外狀況:Type 'PropagatePublicRootCertificate' of Role 'ASCA' raised an exception:<br>The operation on computer 'ASB88RQ22U09' failed: WinRM cannot process the request. The following error occurred while using Kerberos authentication: Cannot find the computer ASB88RQ22U09.local. Verify that the computer exists on the network and that the name provided is spelled correctly at PropagatePublicRootCertificate, C:\NugetStore\Microsoft.AzureStack, at Orchestration.Roles.CertificateAuthority.10.2402.0.14\content\Classes\ASCA\ASCA.psm1: line 38, at C:\CloudDeployment\ECEngine\InvokeInterfaceInternal.psm1: line 127,at Invoke-EceInterfaceInternal, C:\CloudDeployment\ECEngine\InvokeInterfaceInternal.psm1: line 123. |
檢查 DNS 伺服器,以查看叢集節點是否有任何 DNS 記錄遺失。 在遺失 DNS 記錄的節點上套用下列風險降低。 重新啟動 DNS 用戶端服務。 開啟 PowerShell 工作階段,並在受影響的節點上執行下列 Cmdlet: Taskkill /f /fi "SERVICES eq dnscache" |
||||||||||||||||||
部署 | 在此版本中,多節點部署發生遠端工作失敗,導致下列例外狀況:ECE RemoteTask orchestration failure with ASRR1N42R01U31 (node pingable - True): A WebException occurred while sending a RestRequest. WebException.Status: ConnectFailure on [https://<URL>](https://<URL>). |
緩和措施是重新啟動受影響節點上的 ECE 代理程式。 在您的伺服器上,開啟 PowerShell 工作階段並執行下列命令:Restart-Service ECEAgent . |
||||||||||||||||||
新增伺服器 | 在此版本和舊版中,將伺服器新增至叢集時,無法更新 Proxy 略過清單字串以包含新的伺服器。 更新主機上的環境變數 Proxy 略過清單將不會更新 Azure Resource Bridge 或 AKS 上的 Proxy 略過清單。 | 此版本中沒有因應措施。 如果您遇到此問題,請連絡 Microsoft 支援服務 以判斷後續步驟。 | ||||||||||||||||||
新增/修復伺服器 | 在此版本中,新增或修復伺服器時,從現有節點複製軟體負載平衡器或網路控制站 VM 憑證時,就會看到失敗。 失敗是因為部署/更新期間不會產生這些憑證。 | 此版本中沒有因應措施。 如果您遇到此問題,請連絡 Microsoft 支援服務 以判斷後續步驟。 | ||||||||||||||||||
部署 | 在此版本中,發生暫時性問題,導致部署失敗,但發生下列例外狀況:Type 'SyncDiagnosticLevel' of Role 'ObservabilityConfig' raised an exception:*<br>*Syncing Diagnostic Level failed with error: The Diagnostic Level does not match. Portal was not set to Enhanced, instead is Basic. |
由於這是暫時性問題,因此重試部署應該修正此問題。 如需詳細資訊,請參閱如何 重新執行部署。 | ||||||||||||||||||
部署 | 在此版本中,[秘密 URI/位置] 欄位發生問題。 這是標示 為 [非必要] 的必要 字段,會導致 Azure Resource Manager 範本部署失敗。 | 使用透過 Azure Resource Manager 範本部署 Azure Stack HCI 版本 23H2 中的範例參數檔案,以確保所有輸入都以必要格式提供,然後嘗試部署。 如果部署失敗,您也必須清除下列資源,才能 重新執行部署: 1.移除 C:\EceStore 。 2.移除 C:\CloudDeployment 。 3.移除 C:\nugetstore 。 4. Remove-Item HKLM:\Software\Microsoft\LCMAzureStackStampInformation 。 |
||||||||||||||||||
安全 | 針對新的部署,安全核心支援的裝置預設不會啟用動態測量根目錄(DRTM)。 如果您嘗試使用 Enable-AzSSecurity Cmdlet 來啟用 (DRTM),您會看到目前版本中不支援 DRTM 設定的錯誤。 Microsoft建議深度防禦,而 UEFI 安全開機仍會藉由確保只有在簽署並驗證元件時,保護靜態信任根目錄 (SRT) 開機鏈結中的元件。 |
此版本不支援DRTM。 | ||||||||||||||||||
網路功能 | 使用 Proxy 伺服器時,環境檢查會失敗。 根據設計,winHTTP 和 wininet 的略過清單不同,這會導致驗證檢查失敗。 | 請遵循下列因應措施步驟: 1.在健康狀態檢查之前清除 Proxy 略過清單,以及開始部署或更新之前。 2.通過檢查之後,等候部署或更新失敗。 3.再次設定 Proxy 略過清單。 |
||||||||||||||||||
Arc VM 管理 | 當此作業期間自動產生的暫時SPN秘密以連字元開頭時,Arc資源網橋的部署或更新可能會失敗。 | 重試部署/更新。 重試應該重新產生SPN秘密,且作業可能會成功。 | ||||||||||||||||||
Arc VM 管理 | Arc VM 上的 Arc 延伸模組會無限期保持在「建立」狀態。 | 登入 VM、開啟命令提示字元,然後輸入下列命令: Windows: notepad C:\ProgramData\AzureConnectedMachineAgent\Config\agentconfig.json Linux: sudo vi /var/opt/azcmagent/agentconfig.json 接下來,尋找 resourcename 屬性。 刪除附加至資源名稱結尾的 GUID,因此此屬性符合 VM 的名稱。 然後重新啟動 VM。 |
||||||||||||||||||
Arc VM 管理 | 將新的伺服器新增至 Azure Stack HCI 叢集時,不會為新建立的磁碟區自動建立記憶體路徑。 | 您可以手動建立任何新磁碟區的記憶體路徑。 如需詳細資訊,請參閱 建立記憶體路徑。 | ||||||||||||||||||
Arc VM 管理 | 雖然 VM 本身大約在一分鐘內重新啟動,但 Arc VM 作業的重新啟動大約會在 20 分鐘後完成。 | 此版本中沒有已知的因應措施。 | ||||||||||||||||||
Arc VM 管理 | 在某些情況下,邏輯網路的狀態會顯示為 [失敗] Azure 入口網站。 當您嘗試刪除邏輯網路而不先刪除任何資源,例如與該邏輯網路相關聯的網路介面時,就會發生這種情況。 您仍然可以在此邏輯網路上建立資源。 此實例中的狀態會誤導。 |
如果此邏輯網路的狀態在 布建此網路時成功 ,您可以繼續在此網路上建立資源。 | ||||||||||||||||||
Arc VM 管理 | 在此版本中,當您使用 Azure CLI 以連結至它的數據磁碟更新 VM 時,作業會失敗,並出現下列錯誤訊息: 找不到名稱為的虛擬硬碟。 |
針對所有 VM 更新作業使用 Azure 入口網站。 如需詳細資訊,請參閱 管理 Arc VM 和管理 Arc VM 資源。 | ||||||||||||||||||
更新 | 在罕見的情況下,更新 Azure Stack HCI 時可能會遇到此錯誤: Type 'UpdateArbAndExtensions' of Role 'MocArb' raised an exception: Exception Upgrading ARB and Extension in step [UpgradeArbAndExtensions :Get-ArcHciConfig] UpgradeArb: Invalid applianceyaml = [C:\AksHci\hci-appliance.yaml] 。 |
如果您看到此問題,請連絡 Microsoft 支援服務 以協助您進行後續步驟。 | ||||||||||||||||||
網路功能 | 此版本中發生不常的 DNS 用戶端問題,導致部署在兩個節點叢集上失敗,並出現 DNS 解析錯誤: 傳送 RestRequest 時發生 WebException。WebException.Status:NameResolutionFailure。 由於錯誤,第二個節點的 DNS 記錄會在建立后不久刪除,因而產生 DNS 錯誤。 | 重新啟動伺服器。 此作業會註冊 DNS 記錄,以防止它遭到刪除。 | ||||||||||||||||||
Azure 入口網站 | 在某些情況下,Azure 入口網站 可能需要一些時間才能更新,而且檢視可能不是最新的。 | 您可能需要等候 30 分鐘以上才能查看更新的檢視。 | ||||||||||||||||||
Arc VM 管理 | 從 Azure 入口網站 刪除 Arc VM 上的網路介面無法在此版本中運作。 | 使用 Azure CLI 先移除網路介面,然後再將其刪除。 如需詳細資訊,請參閱 移除網路介面 ,請參閱 刪除網路介面。 | ||||||||||||||||||
部署 | 在 Azure 入口網站 中未偵測到以不正確的語法提供 OU 名稱。 不正確的語法包含不支援的字元,例如 &,",',<,> 。 在叢集驗證期間稍後的步驟中偵測到不正確的語法。 |
請確定 OU 路徑語法正確且不包含不支援的字元。 | ||||||||||||||||||
部署 | 透過 Azure Resource Manager 的部署會在 2 小時後逾時。 超過2小時的部署在成功建立叢集時,在資源群組中顯示為失敗。 | 若要監視 Azure 入口網站 中的部署,請移至 Azure Stack HCI 叢集資源,然後移至新的部署專案。 | ||||||||||||||||||
Azure Site Recovery | 在此版本中,Azure Site Recovery 無法安裝在 Azure Stack HCI 叢集上。 | 此版本中沒有已知的因應措施。 | ||||||||||||||||||
更新 | 透過 Azure 更新管理員更新 Azure Stack HCI 叢集時,更新進度和結果可能不會顯示在 Azure 入口網站 中。 | 若要解決此問題,請在每個叢集節點上新增下列登錄機碼(不需要值):New-Item -Path "HKLM:\SYSTEM\CurrentControlSet\Services\HciCloudManagementSvc\Parameters" -force 然後在其中一個叢集節點上重新啟動雲端管理叢集群組。 Stop-ClusterGroup "Cloud Management" Start-ClusterGroup "Cloud Management" 這不會完全補救問題,因為進度詳細數據在更新程序期間可能仍未顯示。 若要取得最新的更新詳細數據,您可以使用 PowerShell擷取更新進度。 |
||||||||||||||||||
更新 | 在罕見情況下,如果失敗的更新停滯在 Azure 更新管理員的進行 中狀態,則會停用 [ 再試一次 ] 按鈕。 | 若要繼續更新,請執行下列 PowerShell 命令:Get-SolutionUpdate |Start-SolutionUpdate . |
||||||||||||||||||
更新 | 在某些情況下,如果命令在命令之後Send-DiagnosticData 執行,SolutionUpdate 命令可能會失敗。 |
請務必關閉用於 Send-DiagnosticData 的 PowerShell 工作階段。 開啟新的 PowerShell 工作階段,並將其用於 SolutionUpdate 命令。 |
||||||||||||||||||
更新 | 在罕見的情況下,從 2311.0.24 套用至 2311.2.4 的更新時,叢集狀態會回報 進行 中,而不是預期 無法更新。 | 重試更新。 如果問題持續發生, 請 連絡 Microsoft 支援服務。 | ||||||||||||||||||
更新 | 嘗試安裝解決方案更新在 CAU 步驟結束時可能會失敗,並包含:There was a failure in a Common Information Model (CIM) operation, that is, an operation performed by software that Cluster-Aware Updating depends on. 如果 Cluster Name 或 Cluster IP Address 資源在節點重新啟動后無法啟動,而且在小型叢集中最典型的情況,就會發生這個罕見的問題。 |
如果您遇到此問題,請連絡 Microsoft 支援服務 以取得後續步驟。 他們可以與您合作,手動重新啟動叢集資源,並視需要繼續更新。 | ||||||||||||||||||
更新 | 將叢集更新套用至 10.2402.3.11 時, Get-SolutionUpdate Cmdlet 可能無法回應,且最終會在大約 10 分鐘後失敗,並出現 RequestTimeoutException。 這可能是在新增或修復伺服器案例之後發生。 |
Start-ClusterGroup 使用和 Stop-ClusterGroup Cmdlet 重新啟動更新服務。 Get-ClusterGroup -Name "Azure Stack HCI Update Service Cluster Group" | Stop-ClusterGroup Get-ClusterGroup -Name "Azure Stack HCI Update Service Cluster Group" | Start-ClusterGroup 成功執行這些 Cmdlet 應該讓更新服務上線。 |
||||||||||||||||||
叢集感知更新 | 繼續節點作業無法繼續節點。 | 這是暫時性的問題,可以自行解決。 等候幾分鐘,然後重試作業。 如果問題持續發生, 請 連絡 Microsoft 支援服務。 | ||||||||||||||||||
叢集感知更新 | 暫停節點作業停滯超過90分鐘。 | 這是暫時性的問題,可以自行解決。 等候幾分鐘,然後重試作業。 如果問題持續發生, 請 連絡 Microsoft 支援服務。 |