針對系統伺服器測試進行疑難排解
若要針對 Windows 硬體實驗室套件 (Windows HLK) System.Server 測試所發生的問題進行疑難排解,請遵循本文中所述的步驟。
本文內容:
一般系統伺服器疑難排解
請檢閱下列主題,以取得伺服器測試的說明:
裝置、驅動程式或系統測試特有的 Windows HLK 主題。
針對伺服器裝置和驅動程式測試,請確定測試中的系統 (SUT) 設定如下:
已安裝正確的 Windows 版本。
已安裝 Server Core 選項。
SUT 至少有四個核心\邏輯處理器。
SUT 至少已安裝 6 GB 的 RAM。
針對存放裝置測試,如果存放裝置是開機裝置,您可能需要有兩個具有存放裝置磁片磁碟機的裝置實例。
如果您收到 Windows HLK Studio 無法將目標新增至專案的錯誤,請重新選取目標,關閉 Windows HLK Studio,然後重新開機 Windows HLK Studio。 錯誤表示資料不會重新整理。
Sysparse 進程會直接執行收集程式 DLL。 第二個程式資產Configuration Manager引擎 (ACME) ,在發生一或多個硬體變更時,監看硬體變更並警示系統。 ACME 會等到發生逾時或經常硬體變更報告停止,再起始訂閱的收集器。
某些測試會在整個測試回合中造成硬體變更。 這會導致 Sysparse 定期執行。 Sysparse 可以耗用大量的記憶體,這是由執行和收集資料的收集器所造成。 Sysparse 不應該干擾測試,因為在大部分情況下,測試不會驗證效能。
請確定已安裝 Windows HLK 控制器的系統具有足夠的硬體功能,以符合測試需求。 如需這些硬體需求的描述,請參閱 Windows HLK 必要條件 。 隨著測試中的裝置和系統數目增加,您可能需要新增更多處理器、記憶體或儲存體。
針對失敗的系統伺服器測試進行疑難排解
如果測試失敗,請遵循下列步驟:
如果在測試啟動的幾分鐘內發生失敗,這通常表示未正確設定某些專案。 重新確認測試環境設定。
如果測試已執行,Windows HLK 控制器中應該會有名為 Srvlog.xml 的記錄檔。 請遵循下列步驟:
在 Windows HLK Studio 中,開啟 [作業監視器]。
流覽至已排程測試的電腦集區。
在 [ 作業執行狀態 ] 窗格中,選取 [Loadgen 伺服器壓力 - 開始測試伺服器]。
在 [ 工作執行狀態] 窗格中,以滑鼠右鍵按一下 [RunJob -Launch 伺服器標誌套件 ],然後選取 [ 子作業結果]。
返回 [ 作業執行狀態 ] 窗格,然後選取 [啟動伺服器標誌套件]。
在 [ 工作執行狀態] 窗格中,以滑鼠右鍵按一下 [啟動 LogGen] 工作 ,然後選取 [ 檢視工作記錄檔]。 記錄會從原始 Loadgen 記錄剖析,並只包含錯誤並傳遞。
若要擷取原始 Loadgen 文字記錄,請重複步驟 1-5,然後按一下滑鼠右鍵 啟動伺服器標誌套件 ,然後選取 [ 流覽作業記錄]。 這會在 Windows HLK 控制器上開啟記錄共用;Loadgen 記錄檔 srv.log 位於共用中。
將 srv.log 檔案拖放到 [記事本]。
在 [記事本] 中,捲動至檔案底部。
從底部向上搜尋字串「Error -」。 相同行中的文字將描述失敗。 您可能必須搜尋數次,才能找出失敗的原因。 記錄檔中的資訊只會提供失敗的高階指標。
Loadgen 要求更多用戶端
如果現有的用戶端無法對 SUT 產生足夠的壓力,Loadgen 會要求更多壓力用戶端 (SCS) 。 這項功能旨在容納大型伺服器,而且某些 SC 可能會在執行時失敗。 一般而言,您應該從八個 SCS 開始。 壓力等級應該在測試的前三到四小時內穩定。 如果需要更多用戶端,您通常會在該時間範圍內看到主控制器中的快顯 (MC) 。 您將有 6 分鐘的時間可以新增用戶端,否則測試將會終止並失敗。
注意
提交開始之後,您無法將更多電腦新增至電腦集區。 如果您使用少於八個用戶端來啟動測試,請先確定您在電腦集區中有額外的用戶端,再開始測試。
如果 Loadgen 在四小時測試之後要求更多用戶端,這可能表示某個專案失敗。 已卸載一或多個現有的用戶端、發生網路連線問題,或另一個問題是防止 SUT 產生所需的 40% 使用率負載。 這可以是 NIC 驅動程式與網路速度結合的問題,或是 Loadgen MC 相依之效能監視器計數器的驅動程式實作問題。
在此情況下,請嘗試下列疑難排解步驟:
若要排除 NIC 中的暫時性硬體故障,請使用相同型號和製造商的不同 NIC。
使用相同製造商的不同型號 NIC,但使用相同的驅動程式。
使用不同的製造商驅動程式的 NIC 和驅動程式。
如果一或多個 NIC 直接安裝在系統面板上,請移至硬體系統設定,並停用該層級的 NIC,讓 Windows 不會偵測到它;然後使用不同的裝置和驅動程式進行測試。
如果多個 NIC 直接安裝在系統面板上,而且您無法將額外的裝置安裝到 PCI Express 位置,請移至硬體系統設定,並停用其中一個 NIC,讓 Windows 不會偵測到它們。
注意
在測試期間,每個偵測到的 NIC 都必須受到壓力。 這需要每個 NIC 在個別的實體網路區段上都有 SCS。
內建進階功能的參數可能會以各種方式干擾測試。 例如:
如果交換器偵測到已卸載的封包或其他埠錯誤,交換器可以讓交換器中的埠變慢。 如果 SUT 上的 10GigE NIC 是要接收從所有埠變慢到 1 GigE 所產生的流量,則 Loadgen 測試無法達到通過測試所需的 40% 網路頻寬使用率等級。
交換器可以路由傳送流量或區隔網路,以回應交換器內部 (的規則和邏輯,例如負載平衡、備援、服務品質 (QoS) 、鏡像、雙工與雙工。 simplex 作業、自適性或智慧型橋接、埠優先順序或 MAC 篩選) ,可能會影響 NIC 的網路頻寬使用率層級。
Error=0x80004005
如果您收到下列錯誤: Main::RunMain:: 測試檢查,Spsrv 已停止,且未通過必要的通過百分比 (100) (Error=0x80004005) 。 在此情況下,請執行下列步驟:
關閉 Windows HLK Studio。
將 SUT 電腦名稱稱變更為 15 個字元或更少。
重新開機 SUT。
開啟 Windows HLK Studio 並重新執行 LoadGen Server Stress - 啟動伺服器測試 。
伺服器壓力測試
當您執行伺服器壓力測試時,請確定將 SUT 連線到 SUT 的網路基礎結構,而且 MC 可以在 SUT 中的網路介面卡層級執行 (NIC) 。 如果 SUT 有一或多個 10GigE NIC,SCS 和網路基礎結構必須符合該效能層級。
請確定連線 DHCP、DNS、Active Directory、Windows HLK 控制器、Windows HLK Studio、SUT、SUT、SCS 和 MC 的網路基礎結構正常運作。 所有系統都必須使用主機名稱或 IP 位址彼此通訊。 這可以使用簡單的 Ping 測試來確認。
請確定 DHCP、DNS 和 Active Directory 伺服器 () 正常運作。 不應該有過時的 DNS 記錄。 DHCP 伺服器應獲授權在網路上運作、設定必須正確、DHCP 範圍必須正確、應該沒有不正確的多路連接,而且 DHCP 系統事件記錄檔中不應該有任何錯誤。 Active Directory 網域控制站應該不會回報任何錯誤,而且必須跨所有系統同步處理時間服務。
在測試環境中使用虛擬機器 (VM)
DHCP、DNS、AD 和其他系統中沒有任何已知問題。 在 VM 中執行 SC 可能會發生問題。 這些問題通常與網路頻寬負載產生有關。 若要避免問題,請確定已設定下列組態:
每個 SC VM 都必須有專用的實體 NIC,才能在連線到 SUT NIC 的網路上放置負載。
您至少必須擁有與 SC VM 親和性的實體 NIC,這些 NIC 至少能夠達到 SUT NIC 的最大頻寬兩倍。
請確定用於 SC VM 的實體系統 () 不會因高階 CPU 使用率而過度耗用,而且所有 VM 都有適當的實體記憶體。