다음을 통해 공유


시스템 서버 테스트 문제 해결

Windows HLK(Windows 하드웨어 랩 키트) System.Server 테스트에서 발생하는 문제를 해결하려면 이 문서에 설명된 단계를 따르세요.

이 문서의 내용

일반 시스템 서버 문제 해결

  1. 서버 테스트에 대한 도움을 얻으려면 다음 항목을 검토하세요.

  2. 서버 디바이스 및 드라이버 테스트의 경우 SUT(테스트 중인 시스템)가 다음과 같이 구성되어 있는지 확인합니다.

    • 올바른 버전의 Windows가 설치되어 있습니다.

    • Server Core 옵션이 설치되어 있습니다.

    • SUT에 최소 4개의 코어\논리 프로세서가 있습니다.

    • SUT에 최소 6GB의 RAM이 설치되어 있습니다.

    • 스토리지 디바이스 테스트에서 스토리지 디바이스가 부팅 디바이스인 경우 스토리지 드라이브가 있는 두 개의 디바이스 인스턴스가 필요할 수 있습니다.

  3. Windows HLK Studio에서 프로젝트에 대상을 추가할 수 없다는 오류가 발생하는 경우 대상을 다시 선택하고 Windows HLK Studio를 닫은 다음, Windows HLK Studio를 다시 시작합니다. 이 오류는 데이터가 새로 고쳐지지 않음을 의미합니다.

  4. Sysparse 프로세스는 Gatherer DLL을 직접 실행합니다. 두 번째 프로세스인 ACME(Asset Configuration Manager Engine)는 하드웨어 변경을 감시하고 하나 이상의 하드웨어 변경이 발생하는 경우 시스템에 경고합니다. ACME는 시간제한이 발생할 때까지 대기하거나 구독된 수집기를 시작하기 전에 자주 발생하는 하드웨어 변경 보고서가 중지될 때까지 기다립니다.

    일부 테스트에서는 테스트 실행 전반에서 하드웨어가 변경됩니다. 이로 인해 Sysparse가 정기적으로 실행됩니다. Sysparse는 대량의 메모리를 사용할 수 있으며, 데이터를 실행하고 수집하는 Gatherer에 의해 발생합니다. 대부분의 경우 테스트에서 성능을 확인하지 않으므로 Sysparse가 테스트를 방해해서는 안 됩니다.

  5. Windows HLK 컨트롤러가 설치된 시스템에 테스트 요구를 충족할 수 있는 적절한 하드웨어 기능이 있는지 확인합니다. 이러한 하드웨어 요구 사항에 대한 설명은 Windows HLK 필수 구성 요소를 참조하세요. 테스트 중인 디바이스 및 시스템의 수가 증가함에 따라 프로세서, 메모리 또는 스토리지를 더 추가해야 할 수 있습니다.

실패한 시스템 서버 테스트 문제 해결

테스트가 실패하면 다음 단계를 수행합니다.

  1. 테스트 시작 후 몇 분 내에 오류가 발생하는 경우 일반적으로 제대로 구성되지 않은 것을 의미합니다. 테스트 환경 설정을 다시 확인합니다.

  2. 테스트가 실행된 경우 Windows HLK 컨트롤러에 Srvlog.xml 로그 파일이 있어야 합니다. 다음 단계를 수행하세요.

    1. Windows HLK Studio에서 작업 모니터를 엽니다.

    2. 예약된 테스트의 머신 풀로 이동합니다.

    3. 작업 실행 상태 창에서 Loadgen 서버 스트레스 - 서버에 대한 테스트 시작을 선택합니다.

    4. 작업 실행 상태 창에서 RunJob - 서버 로고 키트 시작을 마우스 오른쪽 단추로 클릭하고 자식 작업 결과를 선택합니다.

    5. 작업 실행 상태 창으로 돌아가서 서버 로고 키트 시작을 선택합니다.

    6. 작업 실행 상태 창에서 LogGen 작업 시작을 마우스 오른쪽 단추로 클릭하고 작업 로그 보기를 선택합니다. 로그는 원래 Loadgen 로그에서 구문 분석되며 오류 및 통과 결과만 포함합니다.

    7. 원래 Loadgen 텍스트 로그를 검색하려면 1~5단계를 반복한 다음, 서버 로고 키트 시작을 마우스 오른쪽 단추로 클릭하고 작업 로그 찾아보기를 선택합니다. 그러면 Windows HLK 컨트롤러에서 로그 공유가 열리고 Loadgen 로그 파일 srv.log가 공유에 있습니다.

    8. srv.log 파일을 메모장으로 끌어서 놓습니다.

    9. 메모장 파일의 아래쪽으로 스크롤합니다.

    10. 아래쪽에서 위쪽까지 “Error -” 문자열을 검색합니다. 동일한 줄의 텍스트에 실패에 대한 설명이 표시됩니다. 오류의 원인을 찾으려면 여러 번 검색해야 할 수 있습니다. 로그 파일의 정보는 실패에 대해 개략적인 내용만 표시합니다.

Loadgen이 더 많은 클라이언트를 요청함

기존 클라이언트가 SUT에 대해 충분한 스트레스를 생성할 수 없는 경우 Loadgen은 더 많은 SC(스트레스 클라이언트)를 요청합니다. 이 기능은 대형 서버를 수용하기 위한 것이며, 실행 도중에 일부 SC가 실패할 가능성이 있습니다. 일반적으로 8개의 SC로 시작해야 합니다. 스트레스 수준은 테스트의 처음 3~4시간 동안 안정화되어야 합니다. 더 많은 클라이언트가 필요한 경우 일반적으로 해당 시간 프레임 안에 MC(마스터 컨트롤러)에 팝업이 표시됩니다. 새 클라이언트를 추가하는 데 60분이 걸립니다. 그렇지 않으면 테스트가 종료되고 실패합니다.

참고

제출이 시작된 후에는 머신 풀에 머신을 더 추가할 수 없습니다. 8개 미만의 클라이언트를 사용하여 테스트를 시작하는 경우 테스트를 시작하기 전에 머신 풀에 추가 클라이언트가 있는지 확인합니다.

Loadgen이 4시간의 테스트 후 더 많은 클라이언트를 요청하는 경우 오류가 발생했음을 의미할 수 있습니다. 하나 이상의 기존 클라이언트가 삭제되었거나, 네트워크 연결 문제가 발생했거나, 또 다른 문제로 인해 SUT가 필요한 40% 사용률 부하를 감지하지 못합니다. 이는 네트워크 속도와 함께 NIC 드라이버 또는 Loadgen MC가 종속되는 성능 모니터 카운터의 드라이버 구현 문제일 수 있습니다.

이 경우 다음 문제 해결 단계를 시도합니다.

  1. NIC에서 일시적인 하드웨어 오류가 발생하지 않도록 하려면 동일한 모델 및 제조업체인 다른 NIC를 사용합니다.

  2. 동일한 제조업체에서 제작했지만 다른 드라이버를 사용하는 다른 모델 NIC를 사용합니다.

  3. 다른 제조업체 드라이버의 NIC 및 드라이버를 사용합니다.

  4. 하나 이상의 NIC가 시스템 보드에 직접 설치된 경우 하드웨어 시스템 설정으로 이동한 후 해당 수준에서 NIC를 사용하지 않도록 설정하여 Windows에서 검색되지 않도록 합니다. 그런 다음, 테스트에 다른 디바이스와 드라이버를 사용합니다.

  5. 여러 NIC가 시스템 보드에 직접 설치되어 있고 PCI Express 슬롯에 추가 디바이스를 설치할 수 없는 경우 하드웨어 시스템 설정으로 이동하여 NIC 중 하나를 제외한 모든 NIC를 사용하지 않도록 설정하여 Windows에서 검색되지 않도록 합니다.

참고

검색된 각 NIC에는 테스트 중에 스트레스를 적용해야 합니다. 이렇게 하려면 각 NIC의 별도 물리적 네트워크 세그먼트에 SC가 있어야 합니다.

고급 기능이 기본 제공되는 스위치는 다양한 방법으로 테스트를 방해할 수 있습니다. 예:

  • 스위치는 한 포트에서 삭제된 패킷 또는 다른 오류를 감지하는 경우 스위치의 포트 속도를 늦출 수 있습니다. SUT의 10GigE NIC가 1GigE로 느려진 모든 포트에서 받은 트래픽을 수신하려는 경우 Loadgen 테스트는 테스트를 통과하는 데 필요한 필수 40% 네트워크 대역폭 사용률 수준에 도달할 수 없습니다.

  • 스위치는 부하 분산, 중복성, QoS(서비스 품질), 미러링, 이중 및 단면 작업, 적응형 또는 인텔리전트 브리징, 포트 우선 순위 지정 또는 MAC 필터링 등과 같이 NIC의 네트워크 대역폭 사용률 수준에 영향을 미칠 수 있는 스위치 내부의 규칙 및 논리에 대한 응답으로 트래픽을 라우팅하거나 네트워크를 분할할 수 있습니다.

Error=0x80004005

Main::RunMain:: 테스트 검사 Spsrv가 중지되고 필요한 통과 백분율(100)을 통과하지 못했습니다(Error=0x80004005). 오류가 발생할 수 있습니다. 이 경우 다음 단계를 수행합니다.

  1. Windows HLK Studio를 닫습니다.

  2. SUT 컴퓨터 이름을 15자 이하로 변경합니다.

  3. SUT를 다시 부팅합니다.

  4. Windows HLK Studio를 열고 LoadGen 서버 스트레스 - 서버에 대한 테스트 시작 테스트를 다시 실행합니다.

서버 스트레스 테스트

서버 스트레스 테스트를 수행할 때 SUT를 SC에 연결하는 네트워크 인프라와 MC가 SUT의 NIC(네트워크 인터페이스 카드) 수준에서 잘 작동할 수 있는지 확인합니다. SUT에 하나 이상의 10GigE NIC가 있는 경우 SC 및 네트워크 인프라는 해당 수준의 성능을 충족해야 합니다.

DHCP, DNS, Active Directory, Windows HLK 컨트롤러, Windows HLK Studio, SUT, SC 및 MC를 연결하는 네트워크 인프라가 올바르게 작동하는지 확인합니다. 모든 시스템은 호스트 이름 또는 IP 주소를 사용하여 서로 통신해야 합니다. 이는 간단한 ping 테스트를 사용하여 확인할 수 있습니다.

DHCP, DNS 및 Active Directory 서버가 제대로 작동하는지 확인합니다. 부실 DNS 레코드가 없어야 합니다. DHCP 서버는 네트워크에서 작동할 수 있는 권한이 있어야 하고, 구성이 올바르고, DHCP 범위가 올바르고, 잘못된 멀티 호밍이 없어야 하며, DHCP 시스템 이벤트 로그에 오류가 없어야 합니다. Active Directory 도메인 컨트롤러는 오류를 보고하지 않아야 하며 모든 시스템에서 시간 서비스를 동기화해야 합니다.

테스트 환경에서 VM(가상 머신) 사용

VM에 있는 DHCP, DNS, AD 및 기타 시스템에 대한 알려진 문제가 없습니다. VM에서 SC를 실행하면 문제가 발생할 수 있습니다. 이러한 문제는 일반적으로 네트워크 대역폭 부하 생성과 관련이 있습니다. 문제를 방지하려면 다음 구성이 설정되어 있는지 확인합니다.

  • SUT NIC에 연결된 네트워크에 부하를 배치하려면 각 SC VM에 전용 물리적 NIC가 있어야 합니다.

  • 적어도 최대 SUT NIC 대역폭의 2배 이상을 수행할 수 있는 SC VM에 선호되는 물리적 NIC가 있어야 합니다.

  • SC VM에 사용되는 물리적 시스템이 높은 수준의 CPU 사용률에 의해 과도한 스트레스를 받지 않는지와 모든 VM에 적절한 실제 메모리가 있는지 확인합니다.

System.Server 테스트