共用方式為


檢視 Azure Stack HCI 2405.2 版本中的已知問題

適用於:Azure Local 2311.2 和更新版本

本文會識別 Azure Stack HCI 2405.2 版本中的重要已知問題及其因應措施。

版本資訊會持續更新,而且當發現需要因應措施的嚴重問題時,就會新增它們。 部署 Azure Stack HCI 之前,請先仔細檢閱版本資訊中包含的資訊。

重要

如需此版本支援的更新路徑資訊,請參閱 版本資訊

如需此版本中新功能的詳細資訊,請參閱 23H2 的新功能

2405.2 版的問題

此軟體發行版本對應的軟體版本號為 2405.2.7

此版本的版本資訊包括此版本中已修正的問題、此版本中的已知問題,以及從之前版本延續過來的已記錄問題。

已修正問題

以下是此版本中的修正問題:

特徵 問題 因應措施/批注
更新 在此版本中,已修正與健康狀態檢查中遺漏資源類型標識符字段相關的更新問題。
更新 在此版本中,已修正與名稱相同之不同健康狀態檢查相關的更新問題。
更新 在此版本中,已修正解決方案產生器延伸模組更新健康情況檢查在更新前或每日健康情況檢查中遺漏的問題。
更新 在此版本中,已修正因更新服務在伺服器狀況不佳時崩潰,而導致無法檢視或啟動新更新的問題。
更新 在此版本中,已改善更新服務,以防止叢集上的動作泛濫。
更新 在此版本中,新增了健康檢查,以防止在新增或移除伺服器失敗時進行更新。
Arc VM 管理 在舊版中,VM 的任何電源狀態變更作業,例如啟動停止、儲存和暫停,一開始都會傳回 VM 的狀態為執行中,最後在重新整理 30+ 秒后顯示正確的狀態。 在此版本中,電源狀態變更作業只會在 VM 狀態變更為預期的狀態之後傳回。

此版本中的已知問題

特徵 問題 因應措施
更新 由於 SDN 基礎結構 VM 中的錯誤,一旦主機經過秘密輪替和更新,SDN 就會停止運作。 此版本中沒有此問題的因應措施。 如果發生此問題,請連絡Microsoft支援以取得後續步驟。
更新 由於環境整備檢查程序發生錯誤,實體磁碟環境整備檢查錯誤失敗並封鎖更新。 請等候幾分鐘,然後重試更新。
部署 這個版本中,您可能會收到以下錯誤:雲端部署失敗 - 值不能為 null 此版本中沒有此問題的因應措施。 如果發生此問題,請連絡Microsoft支援以取得後續步驟。
更新 在此版本中,環境檢查失敗,並出現下列錯誤:Update 處於失敗狀態:HealthCheckFailed。來自 ECE 的摘要 XML 不存在 此版本中沒有此問題的因應措施。 如果發生此問題,請連絡Microsoft支援以取得後續步驟。

舊版的已知問題

以下是舊版的已知問題:

特徵 問題 因應措施
更新 透過 Azure 更新管理員檢視 Azure Stack HCI 叢集的整備檢查結果時,可能會有多個具有相同名稱的整備檢查。 此版本中沒有已知的因應措施。 選取 [查看詳細資訊] 以查看整備檢查的特定資訊。
Arc VM 管理 在大型部署場景中,例如大規模AVD主機池部署或大型VM佈署中,您可能會遇到由Hyper-V套接字外部庫問題引起的可靠性問題。 請遵循下列步驟來減輕問題:
執行命令 Get-service mochostagent (\) get-process (\) kill。 檢查命令的輸出,並確認句柄計數是否在數千個中。

2.執行 命令 Get-service mochostagent (\) get-process 以終止進程。

3.執行命令 restart-service mochostagent 重新啟動mochostagent服務。
部署 透過 Azure 入口網站部署 Azure Stack HCI 第 23H2 版時,您可能會遇到下列部署驗證失敗:

Could not complete the operation. 400: Resource creation validation failed. Details: [{"Code":"AnswerFileValidationFailed","Message":"Errors in Value Validation:\r\nPhysicalNodesValidator found error at deploymentdata.physicalnodes[0].ipv4address: The specified for \u0027deploymentdata.physicalnodes[0].ipv4address\u0027 is not a valid IPv4 address. Example: 192.168.0.1 or 192.168.0.1","Target":null,"Details":null}].

如果您移至 Azure 入口網站部署中的 [網络] 索引卷標,在 [網络意圖] 組態內,您可能會看到下列錯誤:選取的實體網路適配器未繫結至管理虛擬交換器。
請在 Azure 入口網站中,遵循 的步驟,對部署驗證失敗進行疑難排解
部署 透過 Azure 入口網站的部署失敗,並出現此錯誤:無法從密鑰保存庫擷取秘密 LocalAdminCredential。 此版本中沒有此問題的因應措施。 如果發生此問題,請連絡Microsoft支援以取得後續步驟。
部署 在某些情況下,在 Azure Stack HCI 伺服器註冊期間,可能會在偵錯記錄中看到此錯誤:發生內部伺服器錯誤。 裝置部署所需的其中一個強制擴充功能可能尚未安裝。 請遵循下列步驟來減輕問題:

$Settings = @{ "CloudName" = $Cloud; "RegionName" = $Region; "DeviceType" = "AzureEdge" }

New-AzConnectedMachineExtension -Name "AzureEdgeTelemetryAndDiagnostics" -ResourceGroupName $ResourceGroup -MachineName $env:COMPUTERNAME -Location $Region -Publisher "Microsoft.AzureStack.Observability" -Settings $Settings -ExtensionType "TelemetryAndDiagnostics" -EnableAutomaticUpgrade

New-AzConnectedMachineExtension -Name "AzureEdgeDeviceManagement" -ResourceGroupName $ResourceGroup -MachineName $env:COMPUTERNAME -Location $Region -Publisher "Microsoft.Edge" -ExtensionType "DeviceManagementExtension"

New-AzConnectedMachineExtension -Name "AzureEdgeLifecycleManager" -ResourceGroupName $ResourceGroup -MachineName $env:COMPUTERNAME -Location $Region -Publisher "Microsoft.AzureStack.Orchestration" -ExtensionType "LcmController"

New-AzConnectedMachineExtension -Name "AzureEdgeRemoteSupport" -ResourceGroupName $ResourceGroup -MachineName $env:COMPUTERNAME -Location $Region -Publisher "Microsoft.AzureStack.Observability" -ExtensionType "EdgeRemoteSupport" -EnableAutomaticUpgrade
更新 在此版本中,有一個間歇性問題,即使更新已完成,Azure 入口網站仍錯誤地回報更新狀態為 無法更新進行中 透過遠端 PowerShell 工作階段連線到您的 Azure 本機。 若要確認更新狀態,請執行下列 PowerShell Cmdlet:

$Update = get-solutionupdate| ? version -eq "<version string>"

將版本字串替換為您正在執行的版本。 例如,“10.2405.0.23”。

$Update.state

如果更新狀態 已安裝,則您不需要採取進一步的動作。 Azure 入口網站可以在24小時內正確重新整理狀態。
若要更快重新整理狀態,請遵循其中一個叢集節點上的這些步驟。
重新啟動雲端管理叢集群組。
Stop-ClusterGroup "Cloud Management"
Start-ClusterGroup "Cloud Management"
更新 在初始MOC更新期間,因為目錄快取中找不到目標MOC版本,所以會發生失敗。 後續更新和重試會在目標版本中顯示MOC,而沒有更新成功,因此Arc Resource Bridge 更新會失敗。

若要驗證此問題,請使用 的疑難排解工具,以針對 Azure Stack HCI 版本 23H2的解決方案更新收集更新記錄。 記錄檔應該會顯示類似的錯誤訊息(目前版本在錯誤訊息中可能不同):

[ERROR: { "errorCode": "InvalidEntityError", "errorResponse": "{\n\"message\": \"the cloud fabric (MOC) is currently at version v0.13.1. A minimum version of 0.15.0 is required for compatibility\"\n}" }]
請遵循下列步驟來減輕問題:

1.若要尋找 MOC 代理程式版本,請執行下列命令:'C:\Program Files\AksHci\wssdcloudagent.exe' version

2.使用 命令的輸出,從下表中尋找符合代理程式版本的MOC版本,並將 $initialMocVersion 設定為該MOC版本。 若要設定 $targetMocVersion,請先尋找您要更新的 Azure Stack HCI 組建,然後從下表中取得相符的 MOC 版本。 在以下提供的緩解腳本中使用這些值:

組建 MOC 版本 代理程式版本
2311.21.0.24.10106v0.13.0-6-gf13a73f7, v0.11.0-alpha.38,01/06/2024
24021.0.25.10203v0.14.0、v0.13.1、02/02/2024
2402.11.0.25.10302v0.14.0、v0.13.1、03/02/2024
2402.21.1.1.10314v0.16.0-1-g04bf0dec, v0.15.1, 03/14/2024
2405/2402.31.3.0.10418v0.17.1、v0.16.5、04/18/2024


例如,如果代理程式版本是 v0.13.0-6-gf13a73f7,v0.11.0-alpha.38,01/06/2024,則 $initialMocVersion = “1.0.24.10106”,如果您要更新為 2405.0.23,則 $targetMocVersion = “1.3.0.10418”

3.在第一個節點上執行下列 PowerShell 命令:

$initialMocVersion = "<initial version determined from step 2>"
$targetMocVersion = "<target version determined from step 2>"

# 匯入MOC模組兩次
import-module moc
import-module moc
$verbosePreference = "Continue"

# 清除 SFS 目錄快取
Remove-Item (Get-MocConfig).manifestCache

# 將版本設定為更新之前的目前MOC版本,並將狀態設定為更新失敗
Set-MocConfigValue -name "version" -value $initialMocVersion
Set-MocConfigValue -name "installState" -value ([InstallState]::UpdateFailed)

# 將MOC更新重新執行至所需的版本
Update-Moc -version $targetMocVersion

4.繼續更新。
HCI 上的 AKS AKS 叢集建立失敗,發生 Error: Invalid AKS network resource id。 當相關聯的邏輯網路名稱包含下劃線時,會發生此問題。 底線不支援用於邏輯網路名稱。 請務必不要在 Azure Stack HCI 上部署的邏輯網路名稱中使用底線。
修復伺服器 在罕見的情況下,Repair-Server 作業會失敗,並發生 HealthServiceWaitForDriveFW 錯誤。 在這些情況下,已修復中的節點不會移除舊磁碟驅動器,而且新磁碟會停在維護模式中。 若要避免此問題,請確定您不要透過 Windows Admin Center 清空節點,或使用 Suspend-ClusterNode -Drain PowerShell Cmdlet,再開始 Repair-Server
如果發生此問題,請連絡Microsoft支援以取得後續步驟。
修復伺服器 當單一伺服器 Azure Stack HCI 從 2311 更新至 2402,然後執行 Repair-Server 時,就會看到此問題。 修復作業失敗。 修復單一節點之前,請遵循下列步驟:
1. 執行 ADPrepTool的版本 2402。 請遵循準備Active Directory中的步驟。 此操作迅速,並將必要的權限新增至組織單位(OU)。
2.將計算機物件從 Computers 區段移至根 OU。 執行下列命令:
Get-ADComputer <HOSTNAME> | Move-ADObject -TargetPath "<OU path>"
部署 如果您自行準備 Active Directory(不使用 Microsoft 提供的腳本和程序),您的 Active Directory 驗證可能會因缺少 Generic All 權限而失敗。 這是由於驗證檢查中缺少 msFVE-RecoverInformationobjects – General – Permissions Full control的專用權限條目,而這對於 BitLocker 復原是必要的。 使用 準備 AD 腳稿方法 或使用您自己的方法,請務必指派特定許可權 msFVE-RecoverInformationobjects – General – Permissions Full control
部署 此版本中罕見的問題,其中 DNS 記錄會在 Azure Stack HCI 部署期間遭到刪除。 發生這種情況時,會看到下列例外狀況:
Type 'PropagatePublicRootCertificate' of Role 'ASCA' raised an exception:<br>The operation on computer 'ASB88RQ22U09' failed: WinRM cannot process the request. The following error occurred while using Kerberos authentication: Cannot find the computer ASB88RQ22U09.local. Verify that the computer exists on the network and that the name provided is spelled correctly at PropagatePublicRootCertificate, C:\NugetStore\Microsoft.AzureStack, at Orchestration.Roles.CertificateAuthority.10.2402.0.14\content\Classes\ASCA\ASCA.psm1: line 38, at C:\CloudDeployment\ECEngine\InvokeInterfaceInternal.psm1: line 127,at Invoke-EceInterfaceInternal, C:\CloudDeployment\ECEngine\InvokeInterfaceInternal.psm1: line 123.
檢查 DNS 伺服器,以查看叢集節點是否有任何 DNS 記錄遺失。 對沒有 DNS 記錄的節點套用以下緩解措施。

重新啟動 DNS 用戶端服務。 開啟 PowerShell 工作階段,並在受影響的節點上執行下列 cmdlet:
Taskkill /f /fi "SERVICES eq dnscache"
部署 在此版本中,多節點部署發生遠端工作失敗,導致下列例外狀況:
ECE RemoteTask orchestration failure with ASRR1N42R01U31 (node pingable - True): A WebException occurred while sending a RestRequest. WebException.Status: ConnectFailure on [https://<URL>](https://<URL>).
緩和措施是重新啟動受影響節點上的 ECE 代理程式。 請在您的伺服器上開啟 PowerShell 然後運行以下命令:
Restart-Service ECEAgent
新增伺服器 在此版本和舊版中,將伺服器新增至叢集時,無法更新 Proxy 略過清單字串以包含新的伺服器。 更新主機上的環境變數 Proxy 略過清單將不會更新 Azure Resource Bridge 或 AKS 上的 Proxy 略過清單。 此版本中沒有任何解決方案。 如果您遇到此問題,請連絡Microsoft支援以判斷後續步驟。
新增/修復伺服器 在此版本中,當新增或修復伺服器時,若從現有節點複製軟體負載平衡器或網路控制器 VM 憑證,過程中會發生失敗。 失敗是因為部署/更新期間不會產生這些憑證。 此版本中沒有因應措施。 如果您遇到此問題,請連絡Microsoft支援以判斷後續步驟。
部署 在此版本中,發生暫時性問題,導致部署失敗,但發生下列例外狀況:
Type 'SyncDiagnosticLevel' of Role 'ObservabilityConfig' raised an exception:*<br>*Syncing Diagnostic Level failed with error: The Diagnostic Level does not match. Portal was not set to Enhanced, instead is Basic.
由於這是暫時性問題,因此重試部署應該修正此問題。 如需詳細資訊,請參閱如何 重新執行部署
部署 在此版本中,[秘密 URI/位置] 欄位發生問題。 這是一個必填字段,然而被標示為 非必要,這樣會導致 Azure Resource Manager 範本部署失敗。 使用 透過 Azure Resource Manager 範本部署 Azure Stack HCI 版本 23H2 中的範例參數檔案,確保所有的輸入符合必要格式,然後嘗試進行部署。
如果部署失敗,您也必須清除下列資源,才能 重新執行部署
1.移除 C:\EceStore
2.刪除 C:\CloudDeployment
3. 刪除 C:\nugetstore
4. Remove-Item HKLM:\Software\Microsoft\LCMAzureStackStampInformation
安全 針對新的部署,安全核心支援的裝置預設不會啟用動態測量根目錄(DRTM)。 如果您嘗試使用 Enable-AzSSecurity Cmdlet 來啟用 (DRTM),您會看到目前版本不支援DRTM設定的錯誤。
Microsoft 建議採取深度防禦策略,而 UEFI 安全開機仍然透過確保元件僅在其已簽署並驗證時,來保護靜態信任根 (SRT) 開機鏈中的元件。
此版本不支援DRTM。
網路 使用 Proxy 伺服器時,環境檢查會失敗。 根據設計,winHTTP 和 wininet 的略過清單不同,這會導致驗證檢查失敗。 請遵循下列因應措施步驟:

1. 在健康狀態檢查之前,以及開始部署或更新之前,清除 Proxy 略過清單。

2.通過檢查之後,等候部署或更新失敗。

3. 再次設定您的代理伺服器的例外清單。
Arc VM 管理 當在此作業期間自動產生的暫時性 SPN 密碼以連字號開頭時,Arc 資源橋接的部署或更新可能會失敗。 重試部署/更新。 重試應該重新產生 SPN 密碼,該作業可能會成功。
Arc VM 管理 Arc VM 上的 Arc 延伸模組會無限期保持在「建立」狀態。 登入 VM、開啟命令提示字元,然後輸入下列命令:
Windows
notepad C:\ProgramData\AzureConnectedMachineAgent\Config\agentconfig.json
Linux
sudo vi /var/opt/azcmagent/agentconfig.json
接下來,尋找 resourcename 屬性。 刪除附加至資源名稱結尾的 GUID,以便該屬性符合 VM 的名稱。 然後重新啟動 VM。
Arc VM 管理 將新的伺服器新增至 Azure Stack HCI 叢集時,不會為新建立的磁碟區自動建立記憶體路徑。 您可以手動建立任何新磁碟區的記憶體路徑。 如需詳細資訊,請參閱 建立記憶體路徑
Arc VM 管理 Arc VM 作業的重新啟動大約需時 20 分鐘完成,儘管 VM 本身只需大約一分鐘即可重新啟動。 此版本中沒有已知的因應措施。
Arc VM 管理 在某些情況下,Azure 入口網站中的邏輯網路狀態會顯示為失敗。 當您嘗試刪除邏輯網路而不先刪除任何資源,例如與該邏輯網路相關聯的網路介面時,就會發生這種情況。
您仍然可以在此邏輯網路上建立資源。 此實例中的狀態會誤導。
如果此邏輯網路在布建時其狀態是 成功,那麼您可以繼續在此網路上建立資源。
Arc VM 管理 在此版本中,當您使用 Azure CLI 以連結至它的數據磁碟更新 VM 時,作業會失敗,並出現下列錯誤訊息:
找不到名稱為的虛擬硬碟。
針對所有 VM 更新作業使用 Azure 入口網站。 如需詳細資訊,請參閱 管理Arc VM管理Arc VM資源
更新 在罕見的情況下,更新 Azure Stack HCI 時可能會遇到此錯誤:Type 'UpdateArbAndExtensions' of Role 'MocArb' raised an exception: Exception Upgrading ARB and Extension in step [UpgradeArbAndExtensions :Get-ArcHciConfig] UpgradeArb: Invalid applianceyaml = [C:\AksHci\hci-appliance.yaml] 如果您看到此問題,請連絡 Microsoft 支援服務以協助您進行後續步驟。
網路 此版本中發生不常的 DNS 用戶端問題,導致部署在兩個節點叢集上失敗,且發生 DNS 解析錯誤:傳送 RestRequest 時發生 webException 。WebException.Status:NameResolutionFailure。 由於錯誤,第二個節點的 DNS 記錄會在建立后不久刪除,因而產生 DNS 錯誤。 重新啟動伺服器。 此作業會註冊 DNS 記錄,以防止它遭到刪除。
Azure 入口網站 在某些情況下,Azure 入口網站可能需要一些時間才能更新,而且檢視可能不是最新的。 您可能需要等候 30 分鐘以上才能查看更新的檢視。
Arc VM 管理 從 Azure 入口網站刪除 Arc VM 上的網路介面無法在此版本中運作。 使用 Azure CLI 先移除網路介面,然後再將其刪除。 如需詳細資訊,請參閱 移除網路介面,請參閱 刪除網路介面
部署 在 Azure 入口網站中,不會偵測到以不正確語法提供的 OU 名稱。 不正確的語法包含不支援的字元,例如 &,",',<,>。 在叢集驗證期間稍後的步驟中偵測到不正確的語法。 請確定 OU 路徑語法正確且不包含不支援的字元。
部署 透過 Azure Resource Manager 的部署會在 2 小時後超時。 超過2小時的部署,儘管叢集已成功建立,但在資源群組中顯示為失敗。 若要在 Azure 入口網站中監視部署,請移至 Azure Stack HCI 叢集資源,然後前往新 部署 條目。
Azure Site Recovery 在此版本中,Azure Site Recovery 無法安裝在 Azure Stack HCI 叢集上。 此版本中沒有已知的因應措施。
更新 透過 Azure 更新管理員更新 Azure Stack HCI 叢集時,Azure 入口網站中可能不會顯示更新進度和結果。 若要解決此問題,請在每個叢集節點上新增下列登錄機碼(不需要值):

New-Item -Path "HKLM:\SYSTEM\CurrentControlSet\Services\HciCloudManagementSvc\Parameters" -force

然後在其中一個叢集節點上重新啟動雲端管理叢集群組。

Stop-ClusterGroup "Cloud Management"

Start-ClusterGroup "Cloud Management"

這不會完全補救問題,因為進度詳細數據在更新程序期間可能仍未顯示。 若要取得最新的更新詳細數據,您可以使用PowerShell擷取更新進度。
更新 在少見的情況下,如果失敗的更新卡住,無法進一步完成並停留在 Azure Update Manager 的 進行中 狀態中,則 再試一次 按鈕將會被停用。 若要繼續更新,請執行下列 PowerShell 命令:
Get-SolutionUpdate | Start-SolutionUpdate
更新 在某些情況下,如果 Send-DiagnosticData 命令之後執行,SolutionUpdate 命令可能會失敗。 請務必關閉用於 Send-DiagnosticData的 PowerShell 工作階段。 開啟新的 PowerShell 會話,並將其用於 SolutionUpdate 命令。
更新 在罕見的情況下,從 2311.0.24 套用至 2311.2.4 的更新時,叢集狀態報告 進行中,而不是預期 無法更新 重試更新。 如果問題持續發生,請連絡Microsoft支援。
更新 嘗試安裝解決方案更新在 CAU 步驟的最後階段可能會失敗:
There was a failure in a Common Information Model (CIM) operation, that is, an operation performed by software that Cluster-Aware Updating depends on.
如果 Cluster NameCluster IP Address 資源在節點重新啟動后無法啟動,而且在小型叢集中最為常見,就會發生這個罕見的問題。
如果您遇到此問題,請連絡Microsoft支援以取得後續步驟。 他們可以與您合作,手動重新啟動叢集資源,並視需要繼續更新。
更新 將叢集更新套用至 10.2402.3.11 時,Get-SolutionUpdate Cmdlet 可能不會回應,而且最終會在大約 10 分鐘後失敗,並出現 RequestTimeoutException。 這可能是在新增或修復伺服器案例之後發生。 使用 Start-ClusterGroupStop-ClusterGroup Cmdlet 重新啟動更新服務。

Get-ClusterGroup -Name "Azure Stack HCI Update Service Cluster Group" | Stop-ClusterGroup

Get-ClusterGroup -Name "Azure Stack HCI Update Service Cluster Group" | Start-ClusterGroup

成功執行這些 cmdlet,應該會使更新服務上線。
叢集感知式更新 恢復節點操作未能恢復節點。 這是暫時性的問題,可以自行解決。 等候幾分鐘,然後重試作業。 如果問題持續發生,請連絡Microsoft支援。
叢集感知更新 暫停節點作業停滯超過90分鐘。 這是暫時性的問題,可以自行解決。 等候幾分鐘,然後重試作業。 如果問題持續發生,請連絡Microsoft支援。

後續步驟