Container Insights의 보고서
Container Insights의 보고서에는 기본 제공 Azure 통합 문서가 권장됩니다. 이 문서에서는 사용할 수 있는 다양한 통합 문서와 이러한 통합 문서에 액세스하는 방법을 설명합니다.
참고 항목
컨테이너 인사이트에 대한 Prometheus 환경을 활성화하는 경우 보고서 탭을 사용할 수 없습니다. 클러스터에 대한 통합 문서 페이지에서 통합 문서에 계속 액세스할 수 있습니다.
통합 문서 보기
Azure Portal의 Azure Monitor 메뉴에서 컨테이너를 선택합니다. 모니터링 섹션에서 인사이트를 선택하고 특정 클러스터를 선택한 다음, 보고서 탭을 선택합니다. Azure Monitor의 통합 문서 갤러리에서도 볼 수 있습니다.
클러스터 최적화 통합 문서
클러스터 최적화 통합 문서에서는 Kubernetes 클러스터의 상태 및 성능을 빠르게 볼 수 있는 여러 분석기를 제공합니다. 각각 클러스터와 관련된 다양한 정보를 제공하는 여러 분석기가 있습니다. 일단 클러스터에서 컨테이너 인사이트를 사용하도록 설정하면 통합 문서에 구성이 필요하지 않습니다.
활동성 프로브 실패
활동성 프로브 실패 분석기는 최근에 실패한 활동성 프로브와 빈도를 보여 줍니다. 발생 시계열을 보려면 하나를 선택합니다. 이 분석기에는 다음 열이 있습니다.
- 합계: 전체 시간 범위에서 활동성 프로브 실패 수를 계산합니다.
- 컨트롤러 합계: 컨트롤러에서 관리하는 모든 컨테이너의 활동성 프로브 실패 수를 계산합니다.
이벤트 변칙
이벤트 변칙 분석기는 더 쉬운 분석을 위해 유사한 이벤트를 함께 그룹화합니다. 또한 최근에 볼륨이 증가한 이벤트 그룹을 보여 줍니다. 목록의 이벤트는 공통 구에 따라 그룹화됩니다. 예를 들어 "pod-abc-123 실패, 이미지를 끌어올 수 없음" 및 "pod-def-456 실패, 이미지를 끌어올 수 없음" 이라는 메시지가 포함된 두 이벤트가 함께 그룹화됩니다. 최근에 이벤트가 더 많이 발생한 급증 열입니다. 예를 들어, 지난 달에 이벤트 A 및 B가 평균적으로 하루에 10번 발생했지만 이벤트 A가 어제 1000번 발생했고 이벤트 B가 어제 2번 발생한 경우 이벤트 A는 B보다 급증 순위가 훨씬 더 높습니다.
컨테이너 최적화 프로그램
컨테이너 최적화 프로그램 분석기는 과도한 CPU 및 메모리 제한/요청이 있는 컨테이너를 표시합니다. 각 타일은 동일한 사양을 가진 여러 컨테이너를 나타낼 수 있습니다. 예를 들어 배포에서 컨테이너 C1 및 C2를 사용하여 각각 100개의 동일한 Pod를 만드는 경우 모든 C1 컨테이너에 대해 단일 타일과 모든 C2 컨테이너에 대한 단일 타일이 있습니다. 설정된 제한 및 요청이 있는 컨테이너는 녹색부터 빨간색까지 그라데이션 색으로 표시됩니다.
Important
이 보기는 kube-system 네임스페이스의 컨테이너를 포함하지 않으며 Windows Server 노드를 지원하지 않습니다.
각 타일의 숫자는 컨테이너 제한/요청이 최적/제안된 값에서 얼마나 크게 다른지를 나타냅니다. 이 숫자가 0에 가까울수록 좋습니다. 각 타일에는 다음을 나타내는 색이 있습니다.
- 녹색: 잘 설정된 제한 및 요청
- 빨간색: 과도한 제한 또는 요청
- 회색: 설정되지 않은 제한 또는 요청
노드 모니터링 통합 문서
디스크 용량: 다음과 같은 관점에서 컨테이너 내의 노드에 표시되는 각 디스크에 대한 대화형 디스크 사용량 차트입니다.
- 모든 디스크의 디스크 사용 백분율입니다.
- 모든 디스크의 사용 가능한 디스크 공간입니다.
- 각 노드의 디스크, 사용된 공간의 백분율, 사용된 공간의 백분율 추세, 사용 가능한 디스크 공간(GiB) 및 사용 가능한 디스크 공간(GiB) 추세를 보여 주는 표 표에서 행을 선택하면 행 아래에 사용된 공간 백분율 및 사용 가능한 디스크 공간(GiB)이 표시됩니다.
디스크 IO: 다음과 같은 관점에서 컨테이너 내의 노드에 표시되는 각 디스크에 대한 대화형 디스크 사용률 차트입니다.
- 디스크 I/O는 모든 디스크에서 읽기 바이트 수/초, 쓰기 바이트 수/초, 읽기 및 쓰기 바이트 수/초 추세별로 요약되어 표시됩니다.
- 8개의 성능 차트는 디스크 I/O 병목 상태를 측정하고 식별하는 데 도움이 되는 핵심 성과 지표를 표시합니다.
GPU: 각 GPU 인식 Kubernetes 클러스터 노드에 대한 대화형 GPU 사용량 차트입니다.
참고 항목
Kubernetes 업스트림 공지 사항에 따라 GPU 메트릭 컬렉션은 기본적으로 사용하지 않도록 설정됩니다. GPU 메트릭을 계속 수집하는 방법에 대한 지침은 컨테이너 인사이트를 사용하여 GPU 모니터링 구성을 참조하세요.
서브넷 IP 사용량: 다음 관점에서 클러스터 내의 각 노드에 대한 대화형 IP 사용 차트:
- 서브넷에서 할당된 IP입니다.
- Pod에 할당된 IP입니다.
참고 항목
기본적으로 16개의 IP가 서브넷에서 각 노드로 할당됩니다. 이는 16보다 작도록 수정할 수 없습니다. 서브넷 IP 사용 현황 메트릭을 사용하도록 설정하는 방법에 대한 지침은 IP 서브넷 사용량 모니터링을 참조하세요.
리소스 모니터링 통합 문서
배포: 사용자 지정 HPA를 포함하여 배포 및 HPA(Horizontal Pod Autoscaler)의 상태입니다.
워크로드 세부 정보: 네임스페이스에 대한 워크로드의 성능 통계를 보여주는 대화형 차트입니다. 다음과 같은 여러 탭을 포함합니다.
- Pod별 CPU 및 메모리 사용량의 개요입니다.
- Pod 다시 시작 추세, 컨테이너 다시 시작 추세 및 Pod의 컨테이너 상태를 보여주는 POD/컨테이너 상태입니다.
- 컨트롤러에 대한 이벤트의 요약을 보여주는 Kubernetes 이벤트입니다.
Kubelet: 키 노드 작동 통계를 표시하는 두 개의 그리드를 포함합니다.
- 노드당 개요 그리드는 각 노드에 대한 백분율 및 추세별로 총 작업, 총 오류 및 성공한 작업을 요약해서 보여 줍니다.
- 작업 유형별 개요는 각 작업에 대해 총 작업, 총 오류, 성공한 작업을 백분율 및 추세로 요약해서 보여 줍니다.
청구 통합 문서
데이터 사용량: 설명서에서 공유하는 쿼리 라이브러리를 직접 작성하지 않고도 데이터 원본을 시각화할 수 있습니다. 이 통합 문서에서는 다음과 같은 청구 가능한 데이터를 표시하는 차트를 볼 수 있습니다.
- 솔루션별로 수집된 총 청구 가능한 데이터(GB).
- 컨테이너 로그(애플리케이션 로그)별로 수집된 청구 가능한 데이터.
- Kubernetes 네임스페이스별로 수집된 청구 가능한 컨테이너 로그 데이터.
- 클러스터 이름별로 수집 및 분리된 청구 가능한 컨테이너 로그 데이터.
- 로그 소스 항목별로 수집된 청구 가능한 컨테이너 로그 데이터입니다.
- 진단 기본 노드 로그별로 수집된 청구 가능한 진단 데이터입니다.
네트워킹 통합 문서
NPM 구성: NPM(네트워크 정책 관리자)을 통해 다음에 대해 구성된 네트워크 구성 모니터링:
- 전반적인 구성 복잡성에 대한 요약 정보입니다.
- 시간에 따른 정책, 규칙 및 집합 수를 통해 세 가지 항목 간 관계를 파악하고 구성을 디버그할 시간 차원을 추가할 수 있습니다.
- 모든 IPSet 및 각 IPSet의 항목 수
- 네트워크 구성에 구성 요소를 추가하기 위한 노드당 최악 성능 및 평균 성능입니다.
네트워크: 각 노드의 네트워크 어댑터에 대한 대화형 네트워크 사용률 차트입니다. 그리드는 네트워크 어댑터의 성능을 측정하는 데 도움이 되는 주요 성능 지표를 제공합니다.
사용자 지정 통합 문서 만들기
이러한 통합 문서 중 하나를 기준으로 사용자 지정 통합 문서를 만들려면 통합 문서 보기 드롭다운 목록을 선택한 다음, 목록 아래에 있는 AKS 갤러리로 이동을 선택합니다. 통합 문서 및 통합 문서 템플릿 사용에 대한 자세한 내용은 Azure Monitor 통합 문서를 참조하세요.
다음 단계
Azure Monitor의 통합 문서에 대한 자세한 내용은 Azure Monitor 통합 문서를 참조하세요.