Azure Monitor 경고에 대한 모범 사례
이 문서에서는 Azure Monitor 경고, 경고 처리 규칙 및 작업 그룹에 대한 아키텍처 모범 사례를 제공합니다. 이 지침은 Azure Well-Architected Framework에 설명된 뛰어난 아키텍처의 5가지 원칙을 핵심 요소로 합니다.
경고 및 알림에 대한 자세한 내용은 Azure Monitor 경고 개요를 참조하세요. 대규모 경고 솔루션에 대한 자세한 내용은 대규모 경고를 참조하세요.
안정성
클라우드에서도 오류가 발생한다는 것을 인정합니다. 목표는 모든 장애를 막는 것이 아니라 단일 장애 구성 요소의 영향을 최소화하는 것입니다. 다음 정보를 사용하여 Azure Monitor 경고 규칙 구성 요소의 오류를 최소화합니다.
Azure Monitor 경고는 디자인 결정 없이도 높은 수준의 안정성을 제공합니다. 일시적인 경고 데이터 손실이 발생할 수 있는 조건은 다른 Azure Monitor 구성 요소의 기능에 의해 완화되는 경우가 많습니다.
디자인 검사 목록
- 서비스 상태 경고 규칙을 구성합니다.
- 리소스 상태 경고 규칙을 구성합니다.
- 대규모 경고를 생성하는 경고 규칙에 대한 서비스 제한을 방지합니다.
구성 권장 사항
권장 | 장점 |
---|---|
서비스 상태 경고 규칙을 구성합니다. | 서비스 상태 경고는 중단, 서비스 중단, 계획된 유지 관리 및 보안 권고에 대한 경고를 보냅니다. 경고 규칙 만들기 또는 편집을 참조하세요. |
리소스 상태 경고 규칙을 구성합니다. | Resource Health 경고는 이러한 리소스의 상태가 변경되면 거의 실시간으로 알려줍니다. 경고 규칙 만들기 또는 편집을 참조하세요. |
대규모 경고를 생성하는 경고 규칙에 대한 서비스 제한을 방지합니다. | 많은 수의 알림을 보내는 경고 규칙이 있는 경우 이메일 또는 SMS 알림을 보내는 데 사용하는 서비스에 대한 서비스 한도에 도달할 수 있습니다. 프로그래밍 방법의 작업을 구성하거나 대체 알림 방법이나 공급자를 선택하여 대규모 알림을 처리합니다. 알림 서비스 제한을 참조하세요. |
보안
보안은 아키텍처의 가장 중요한 측면 중 하나입니다. Azure Monitor는 최소 권한 원칙과 심층 방어 원칙을 모두 사용하는 기능을 제공합니다. 다음 정보를 사용하여 Azure Monitor 경고의 보안을 최대화합니다.
디자인 검사 목록
- 작업 영역에서 데이터와 저장된 쿼리를 보호하기 위해 자체 암호화 키가 필요한 경우 고객 관리형 키를 사용합니다.
- 관리 ID를 사용하여 권한을 제어하여 보안을 강화합니다.
- 구성 권한이 필요하지 않은 모든 사용자에게 모니터링 읽기 권한자 역할 할당
- 보안 웹후크 작업 사용
- 프라이빗 링크를 사용하는 작업 그룹을 사용하는 경우 이벤트 허브 작업을 사용합니다.
구성 권장 사항
권장 | 장점 |
---|---|
작업 영역의 데이터와 저장된 쿼리를 보호하기 위해 자체 암호화 키가 필요한 경우 고객 관리형 키를 사용합니다. | Azure Monitor를 사용하면 모든 데이터 및 저장된 쿼리가 MMK(Microsoft 관리형 키)를 사용하여 미사용 상태로 암호화됩니다. 자체 암호화 키가 필요하고 전용 클러스터에 충분한 데이터를 수집하는 경우 고객 관리형 키를 사용하여 유연성을 높이고 키 수명 주기 제어를 강화합니다. Microsoft Sentinel을 사용하는 경우 Microsoft Sentinel 고객 관리형 키 설정의 고려 사항을 숙지해야 합니다. |
로그 검색 경고 규칙에 대한 권한을 제어하려면 로그 검색 경고 규칙에 대해 관리 ID를 사용합니다. | 개발자의 일반적인 과제는 서비스 간의 통신을 보호하는 데 사용되는 비밀, 자격 증명, 인증서 및 키를 관리하는 것입니다. 관리 ID를 통해 개발자는 이러한 자격 증명을 관리할 필요가 없습니다. 로그 검색 경고 규칙에 대한 관리 ID를 설정하면 경고 규칙의 정확한 권한을 제어하고 확인할 수 있습니다. 언제든지 규칙의 쿼리 권한을 보고 관리 ID에서 직접 권한을 추가하거나 제거할 수 있습니다. 또한 규칙의 쿼리가 ADX(Azure Data Explorer) 또는 ARG(Azure Resource Graph)에 액세스하는 경우 관리 ID를 사용해야 합니다. 관리 ID를 참조하세요. |
구성 권한이 필요하지 않은 모든 사용자에게 모니터링 읽기 권한자 역할을 할당합니다. | 사용자에게 해당 역할에 필요한 최소한의 권한을 부여하여 보안을 강화합니다. Azure Monitor의 역할, 권한 및 보안을 참조하세요. |
가능하다면 보안 웹후크 작업을 사용합니다. | 경고 규칙에 웹후크 작업을 사용하는 작업 그룹이 포함된 경우 추가 인증을 위해 보안 웹후크 작업을 사용하는 것이 좋습니다. 보안 웹후크에 대한 인증 구성을 참조하세요. |
비용 최적화
비용 최적화는 불필요한 비용을 줄이고 운영 효율성을 높이는 방법을 표시합니다. 수집하는 데이터의 양을 줄일 수 있는 다양한 구성 옵션과 기회를 이해하면 Azure Monitor 비용을 크게 줄일 수 있습니다. Azure Monitor에서 요금을 청구하는 다양한 방법과 월별 청구서를 확인하는 방법을 알아보려면 Azure Monitor 요금 및 사용량을 참조하세요.
참고 항목
Azure Monitor의 모든 기능에 대한 비용 최적화 권장 사항은 Azure Monitor에서 비용 최적화를 참조하세요.
디자인 검사 목록
- 활동 로그 경고, 서비스 상태 경고 및 리소스 상태 경고는 무료입니다.
- 로그 검색 경고를 사용하는 경우 로그 검색 경고 빈도를 최소화합니다.
- 메트릭 경고를 사용하는 경우 모니터링되는 리소스 수를 최소화합니다.
구성 권장 사항
권장 | 장점 |
---|---|
활동 로그 경고, 서비스 상태 경고 및 리소스 상태 경고는 무료입니다. | Azure Monitor 작업 경고, 서비스 상태 경고 및 리소스 상태 경고는 무료입니다. 이러한 경고 형식을 사용하여 모니터링하려는 내용을 달성할 수 있으면 해당 경고 형식을 사용합니다. |
로그 검색 경고를 사용하는 경우 로그 검색 경고 빈도를 최소화합니다. | 로그 검색 경고를 구성할 때 규칙 평가가 자주 수행될수록 비용이 높아진다는 점을 유념해야 합니다. 이에 따라 규칙을 구성합니다. |
메트릭 경고를 사용하는 경우 모니터링되는 리소스 수를 최소화합니다. | 일부 리소스 종류는 동일한 형식의 여러 리소스를 모니터링할 수 있는 메트릭 경고 규칙을 지원합니다. 이러한 리소스 종류의 경우 규칙이 많은 리소스를 모니터링하면 규칙의 비용이 높아질 수 있다는 점에 유의해야 합니다. 비용을 줄이려면 메트릭 경고 규칙의 범위를 줄이거나 많은 수의 리소스를 모니터링하는 데 비용이 덜 드는 로그 검색 경고 규칙을 사용할 수 있습니다. |
운영 우수성
운영 우수성은 프로덕션에서 서비스를 안정적으로 실행하는 데 필요한 운영 프로세스를 의미합니다. Azure Monitor 경고 지원을 위한 운영 요구 사항을 최소화하려면 다음 정보를 사용합니다.
디자인 검사 목록
- 적절한 경우 메트릭 경고 규칙에 동적 임계값을 사용합니다.
- 가능하다면 하나의 경고 규칙을 사용하여 여러 리소스를 모니터링합니다.
- 대규모로 동작을 제어하려면 경고 처리 규칙을 사용합니다.
- 사용자 지정 속성을 활용하여 진단 향상
- Logic Apps를 활용하여 다양한 시스템을 사용자 지정하고 보강하고 통합합니다.
구성 권장 사항
권장 | 장점 |
---|---|
적절한 경우 메트릭 경고 규칙에 동적 임계값을 사용합니다. | 경고 규칙의 임계값으로 사용할 올바른 숫자를 잘 모를 수 있습니다. 동적 임계값은 기계 학습을 사용하고 알고리즘 및 메서드 집합을 사용하여 추세에 따라 올바른 임계값을 결정하므로 미리 정의된 올바른 임계값을 미리 알 필요가 없습니다. 동적 임계값은 여러 리소스를 모니터링하는 규칙에도 유용하며 모든 리소스에 대해 단일 임계값을 구성할 수는 없습니다. 메트릭 경고의 동적 임계값을 참조하세요. |
가능하다면 하나의 경고 규칙을 사용하여 여러 리소스를 모니터링합니다. | 여러 리소스를 모니터링하는 경고 규칙을 사용하면 하나의 규칙을 관리하여 많은 수의 리소스를 모니터링할 수 있으므로 관리 오버헤드가 줄어듭니다. |
대규모로 동작을 제어하려면 경고 처리 규칙을 사용합니다. | 경고 처리 규칙을 사용하면 만들고 관리해야 하는 경고 규칙의 수를 줄일 수 있습니다. |
진단 기능을 향상하려면 사용자 지정 속성을 사용합니다. | 경고 규칙이 작업 그룹을 사용하는 경우 경고 알림 페이로드에 포함할 고유한 속성을 추가할 수 있습니다. 웹후크, Azure 함수 또는 논리 앱 작업과 같이 작업 그룹에서 호출하는 작업에서 이러한 속성을 사용할 수 있습니다. |
Logic Apps를 사용하여 알림 워크플로를 사용자 지정하고 다양한 시스템과 통합합니다. | Azure Logic Apps를 사용하여 통합을 위한 워크플로를 빌드하고 사용자 지정할 수 있습니다. Logic Apps를 사용하여 경고 알림을 사용자 지정합니다. 마케팅 목록의 구성원을 관리할 수 있습니다. - 사용자 고유의 메일 제목 및 본문 형식을 사용하여 경고 메일을 사용자 지정합니다. - 영향을 받는 리소스에 대한 태그를 조회하거나 로그 쿼리 검색 결과를 가져와 경고 메타데이터를 사용자 지정합니다. - Outlook, Microsoft Teams, Slack 및 PagerDuty와 같은 기존 커넥터를 사용하여 외부 서비스와 통합합니다. 자체 서비스에 대한 논리 앱을 구성할 수도 있습니다. |
성능 효율성
성능 효율성은 사용자가 배치된 요구 사항을 효율적인 방식으로 충족하기 위해 워크로드의 크기를 조정할 수 있는 기능입니다. 경고는 어떠한 디자인 결정 없이도 높은 수준의 성능 효율성을 제공합니다.