HANA 쪽에서 모니터링 및 문제 해결
이 문서에서는 SAP HANA에서 제공하는 리소스를 사용하여 Azure의 SAP HANA(대규모 인스턴스)를 모니터링하고 관련 문제를 해결하는 과정을 살펴보겠습니다.
Azure의 SAP HANA(대규모 인스턴스)와 관련된 문제를 분석하려면 문제의 근본 원인을 좁혀야 합니다. SAP는 도움이 되는 설명서를 다수 게시했습니다. SAP HANA 성능과 관련된 FAQ는 다음 SAP Note에서 찾을 수 있습니다.
- SAP 참고 사항 #2222200 – FAQ: SAP HANA 네트워크
- SAP 참고 사항 #2100040 – FAQ: SAP HANA CPU
- SAP 참고 사항 #199997 – FAQ: SAP HANA 메모리
- SAP 참고 사항 #200000 – FAQ: SAP HANA 성능 최적화
- SAP 참고 사항 #199930 – FAQ: SAP HANA I/O 분석
- SAP 참고 사항 #2177064 – FAQ: SAP HANA 서비스 다시 시작 및 충돌
SAP HANA 경고
첫째, 현재 SAP HANA 경고 로그를 확인합니다. SAP HANA Studio에서 관리 콘솔: 경고: 표시: 모든 경고로 이동합니다. 이 탭은 최소/최대 임계값 설정 범위에 속하지 않는 값(사용 가능한 실제 메모리, CPU 사용률 등)에 대한 SAP HANA 경고를 모두 표시합니다. 기본적으로 검사는 15분마다 자동으로 새로 고쳐집니다.
CPU
임계값을 부적절하게 설정하여 트리거되는 경고는 기본값 또는 보다 적절한 임계값으로 다시 설정합니다.
다음과 같은 경고는 CPU 리소스 문제를 의미할 수 있습니다.
- 호스트 CPU 사용량(경고 5)
- 가장 최근 저장 지점 작업(경고 28)
- 저장 지점 기간(경고 54)
다음을 통해 SAP HANA 데이터베이스에서 높은 CPU 사용량을 확인할 수 있습니다.
- 경고 5(호스트 CPU 사용량)는 현재 또는 과거 CPU 사용량에 발생합니다.
- 개요 화면에 표시된 CPU 사용량
로드 그래프는 높은 CPU 사용량 또는 과거의 높은 사용량을 표시할 수 있습니다.
CPU 사용량이 많아서 트리거되는 경고는 다음과 같은 여러 가지 이유로 인해 발생할 수 있습니다.
- 특정 트랜잭션의 실행
- 데이터 로드
- 응답하지 않는 작업
- 장기 실행 SQL 문
- 잘못된 쿼리 성능(예: HANA 큐브의 BW 사용)
자세한 CPU 사용량 문제 해결 단계는 SAP HANA 문제 해결: CPU 관련 원인 및 솔루션을 참조하세요.
OS(운영 체제)
Linux에서 중요한 SAP HANA 검사 항목은 THP(Transparent Huge Pages)를 사용하지 않도록 설정했는지 확인하는 것입니다. 자세한 내용은 SAP Note #2131662 – SAP HANA 서버의 THP(Transparent Huge Pages)를 참조하세요.
Linux 명령, 즉 cat /sys/kernel/mm/transparent_hugepage/enabled를 통해 THP(Transparent Huge Pages)가 사용하도록 설정되었는지 확인할 수 있습니다.
- always가 괄호로 묶인 경우 THP(Transparent Huge Pages)가 사용됨을 의미합니다([always] madvise never).
- never가 괄호로 묶인 경우 THP(Transparent Huge Pages)가 비활성화됨을 의미합니다(always madvise [never])
다음 Linux 명령은 아무 것도 반환하지 않아야 합니다. rpm -qa | grep ulimit.ulimit가 설치된 것으로 나타나면 즉시 제거합니다.
메모리
SAP HANA 데이터베이스에 할당된 메모리의 양이 예상보다 높다는 사실을 확인할 수 있습니다. 다음 경고는 높은 메모리 사용량에 문제가 있는 경우 표시됩니다.
- 호스트 실제 메모리 사용량(경고 1)
- 이름 서버의 메모리 사용량(경고 12)
- 열 저장소 테이블의 총 메모리 사용량(경고 40)
- 서비스의 메모리 사용량(경고 43)
- 열 스토리지 테이블 중 기본 스토리지의 메모리 사용량(경고 45)
- 런타임 덤프 파일(경고 46)
자세한 메모리 문제 해결 단계는 SAP HANA 문제 해결: 메모리 문제의 근본 원인을 참조하세요.
네트워크
SAP Note #2081065 - SAP HANA 네트워크 문제 해결을 참조하고, 이 SAP Note에 있는 네트워크 문제 해결 단계를 수행합니다.
서버와 클라이언트 간의 왕복 시간을 분석합니다.
- SQL 스크립트 HANA_Network_Clients를 실행합니다.
노드 간 통신을 분석합니다.
- SQL 스크립트 HANA_Network_Services를 실행합니다.
Linux 명령 ifconfig를 실행합니다(패킷 손실의 발생 여부는 출력에서 표시).
Linux 명령 tcpdump를 실행합니다.
또한 오픈 소스 IPERF 도구(또는 유사한 기능)를 사용하여 실제 애플리케이션 네트워크 성능을 측정합니다.
자세한 문제 해결 단계는 SAP HANA 문제 해결: 네트워킹 성능 및 연결 문제를 참조하세요.
Storage
I/O 성능에 문제가 있다고 가정해 보겠습니다. 그러면 최종 사용자가 애플리케이션 또는 시스템 전체를 찾아보거나, 느리게 실행하거나, 응답하지 않거나, 응답을 중지할 수도 있습니다. SAP HANA Studio의 볼륨 탭에서 연결된 볼륨과 각 서비스에서 사용하는 볼륨을 확인할 수 있습니다.
화면 아래쪽([볼륨] 탭)에서 파일 및 I/O 통계와 같은 볼륨의 세부 정보를 볼 수 있습니다.
I/O 문제 해결 단계는 SAP HANA 문제 해결: I/O 관련 근본 원인 및 솔루션을 참조하세요. 디스크 관련 문제 해결 단계는 SAP HANA 문제 해결: 디스크 관련 근본 원인 및 솔루션을 참조하세요.
진단 도구
HANA_Configuration_Minichecks를 통해 SAP HANA Health Check를 수행합니다. 이 도구는 SAP HANA Studio에서 이미 경고로 발생했어야 하는 잠재적으로 중요한 기술 문제를 반환합니다.
SAP 참고 사항 #1969700 - SAP HANA에 대한 SQL 문 컬렉션을 참조하고 참고 사항에 연결된 SQL Statements.zip 파일을 다운로드합니다. 로컬 하드 드라이브에서 이.zip 파일을 저장합니다.
SAP HANA Studio의 시스템 정보 탭에서 이름 열을 마우스 오른쪽 단추로 클릭하고 가져오기 SQL 문을 선택합니다.
로컬에 저장된 SQL Statements.zip 파일을 선택하고, 해당 SQL 문이 포함된 폴더를 가져옵니다. 이 시점에서 이러한 SQL 문으로 다른 여러 진단 검사를 실행할 수 있습니다.
예를 들어 SAP HANA 시스템 복제 대역폭 요구 사항을 테스트하려면 복제: 대역폭 아래에서 대역폭 문을 마우스 오른쪽 단추로 클릭하고 SQL 콘솔에서 열기를 선택합니다.
입력 매개 변수(수정 섹션)을 변경한 다음 실행할 수 있도록 전체 SQL 문이 열립니다.
또 다른 예제는 복제: 개요에서 문을 마우스 오른쪽 단추로 클릭하는 것입니다. 상황에 맞는 메뉴에서 실행을 선택합니다.
문제 해결에 유용한 정보를 볼 수 있습니다.
HANA_Configuration_Minichecks에 대해서도 동일한 작업을 수행하고 C(중요) 열에 X 표시가 있는지 확인합니다.
샘플 출력:
일반 SAP HANA 검사는 HANA_Configuration_MiniChecks_Rev102.01+1입니다.
현재 실행 중인 SAP HANA 서비스에 대한 개요는 HANA_Services_Overview를 참조하세요.
SAP HANA 서비스 정보(CPU, 메모리 등)에 대한 HANA_Services_Statistics.
SAP HANA 인스턴스에 대한 일반적인 정보의 경우 HANA_Configuration_Overview_Rev110+.
SAP HANA 매개 변수 검사의 경우 HANA_Configuration_Parameters_Rev70+.
다음 단계
펜싱 디바이스를 사용하여 SUSE 운영 체제에서 고가용성을 설정하는 방법에 대해 알아봅니다.