편집

다음을 통해 공유


경쟁 소비자 패턴

Azure 기능
Azure Service Bus

여러 동시 소비자가 동일한 메시징 채널에 수신된 메시지를 처리할 수 있게 해 줍니다. 여러 동시 소비자를 사용하면 시스템에서 여러 메시지를 동시에 처리하여 처리량을 최적화하고 확장성 및 가용성을 향상시키고 작업 부하를 분산시킬 수 있습니다.

컨텍스트 및 문제점

클라우드에서 실행하는 애플리케이션은 많은 요청을 처리할 것으로 예상됩니다. 일반적인 기술은 각 요청을 동기적으로 처리하는 대신 메시징 시스템을 통해 이를 비동기적으로 처리하는 다른 서비스 (소비자 서비스)로 전달하는 애플리케이션에 적합합니다. 이 전략은 요청을 처리하는 동안에 애플리케이션의 비즈니스 논리가 차단되지 않는다는 장점이 있습니다.

요청 횟수는 여러 가지 이유로 인해 시간에 따라 크게 달라질 수 있습니다. 사용자 활동 또는 여러 테넌트가 전송하는 집계 요청의 갑작스러운 증가는 예기치 않은 워크로드를 초래할 수 있습니다. 사용량이 가장 많은 시간에 시스템은 초당 수백 개의 요청을 처리해야 하는 반면, 다른 시간에 요청 횟수는 매우 적을 수 있습니다. 게다가 이러한 요청을 처리하기 위해 수행하는 작업의 특성은 상당히 가변적일 수 있습니다. 소비자 서비스의 단일 인스턴스를 사용하면 해당 인스턴스가 요청으로 넘쳐날 수 있습니다. 또는 애플리케이션에서 오는 메시지의 유입으로 인해 메시징 시스템이 오버로드될 수 있습니다. 이 변동 워크로드를 처리하기 위해 시스템은 소비자 서비스의 여러 인스턴스를 실행할 수 있습니다. 그러나 이러한 소비자는 각 메시지가 단일 소비자에게만 전달되도록 조정되어야 합니다. 워크로드도 인스턴스가 병목 현상을 일으키지 않도록 소비자 사이에서 부하 분산이 필요합니다.

해결 방법

메시지 큐를 사용해 애플리케이션과 소비자 서비스의 인스턴스 사이에 통신 채널을 구현합니다. 애플리케이션은 메시지 형태의 요청을 큐에 게시하고, 소비자 서비스 인스턴스는 메시지를 큐에서 수신해 처리합니다. 이 방법을 통해 소비자 서비스 인스턴스의 동일한 풀을 사용하여 애플리케이션의 인스턴스에서 전송한 메시지를 처리할 수 있습니다. 다음 그림은 메시지 큐를 사용하여 작업을 서비스의 인스턴스로 분산시키는 과정을 보여 줍니다.

메시지 큐를 사용하여 작업을 서비스의 인스턴스로 분산

참고 항목

이러한 메시지의 소비자는 여러 개 있지만 게시 구독 패턴(pub/sub)과는 다릅니다. 경쟁 소비자 접근 방식을 사용하면 각 메시지가 처리를 위해 단일 소비자에게 전달되는 반면 Pub/Sub 접근 방식을 사용하면 모든 소비자가 모든 메시지를 전달합니다.

이 솔루션에는 다음과 같은 이점이 있습니다.

  • 애플리케이션 인스턴스가 전송하는 요청량의 폭넓은 변화를 처리할 수 있는 부하 평준화 시스템을 제공합니다. 큐는 애플리케이션 인스턴스와 소비자 서비스 인스턴스 사이의 버퍼로 작용합니다. 이 버퍼는 애플리케이션과 서비스 인스턴스의 가용성과 응답성에 미치는 영향을 최소화하는 데 도움을 줄 수 있습니다. 자세한 내용은 큐 기반 부하 평준화 패턴을 참조하세요. 일부 장기 실행 처리가 필요한 메시지의 처리는 다른 메시지를 소비자 서비스의 다른 인스턴스가 동시에 처리하는 것을 방지하지 않습니다.

  • 안정성을 향상시킵니다. 생산자가 이 패턴을 사용하는 대신에 소비자와 직접 통신하지만 소비자를 모니터링하지 않는 경우 메시지가 손실되거나 소비자가 실패하면 처리에 실패할 가능성이 매우 높습니다. 이 패턴에서 메시지는 특정 서비스 인스턴스에 전송되지 않습니다. 실패한 서비스 인스턴스는 생산자를 차단하지 않으며, 메시지는 작동 중인 서비스 인스턴스가 처리할 수 있습니다.

  • 소비자 간 또는 생산자와 소비자 인스턴스 간의 복잡한 조정이 필요 없습니다. 메시지 큐는 각 메시지가 한 번 이상 전달되는 것을 보장합니다.

  • 확장이 가능합니다. 자동 스케일링을 적용하는 경우, 시스템은 메시지의 양이 변함에 따라 소비자 서비스의 인스턴스 수를 동적으로 늘리거나 줄일 수 있습니다.

  • 메시지 큐가 트랜잭션 읽기 작업을 제공하는 경우 복원력을 향상시킬 수 있습니다. 소비자 서비스 인스턴스가 트랜잭션 작업의 일부로 메시지를 읽고 처리하며 소비자 서비스 인스턴스가 실패하는 경우 이 패턴은 소비자 서비스의 다른 인스턴스가 선택해 처리할 수 있도록 메시지를 큐에 반환할 수 있습니다. 메시지가 지속적으로 실패할 위험을 완화하려면 배달 못한 편지 큐를 사용하는 것이 좋습니다.

문제 및 고려 사항

이 패턴을 구현할 방법을 결정할 때 다음 사항을 고려하세요.

  • 메시지 정렬. 소비자 서비스 인스턴스가 메시지를 수신하는 순서는 확정되지 않으며 메시지가 만들어진 순서를 반드시 반영하는 것은 아닙니다. idempotent는 메시지를 처리하는 순서에 대한 의존성을 제거하는 데 도움을 주기 때문에 메시지 처리가 idempotent를 제공하도록 시스템을 디자인합니다. 자세한 내용은 Jonathon Oliver의 블로그에서 Idempotency Patterns(Idempotency 패턴)를 참조하세요.

    Microsoft Azure Service Bus 큐는 메시지 세션을 사용해 보장된 메시지의 선입선출 정렬을 구현할 수 있습니다. 자세한 내용은 세션을 사용하는 메시징 패턴을 참조하세요.

  • 복원력을 위한 서비스 디자인. 시스템이 실패한 서비스 인스턴스를 검색하고 다시 시작하도록 디자인된 경우 단일 메시지를 두 번 이상 가져와 처리되는 영향을 최소화하기 위해 서비스 인스턴스가 수행하는 처리를 idempotent 작업으로 구현하는 것이 필요할 수 있습니다.

  • 포이즌 메시지 검색. 잘못된 형식의 메시지 또는 사용할 수 없는 리소스에 액세스를 요구하는 작업은 서비스 인스턴스의 실패를 초래할 수 있습니다. 시스템은 이러한 메시지가 큐에 반환되는 것을 방지해야 하며 대신에 필요한 경우 분석할 수 있도록 이러한 메시지의 세부 정보를 캡처하고 다른 위치에 저장해야 합니다.

  • 결과 처리. 메시지를 처리하는 서비스 인스턴스는 메시지를 생성하는 애플리케이션 논리에서 완전히 분리되며 직접 통신할 수 없습니다. 서비스 인스턴스가 애플리케이션 논리에 다시 전달해야 하는 결과를 생성하는 경우 이 정보는 둘 다에 액세스할 수 있는 위치에 저장되어야 합니다. 애플리케이션 논리가 불완전한 데이터를 검색하지 않도록 시스템은 처리가 완료되는 시점을 표시해야 합니다.

    Azure를 사용하고 있는 경우 작업자 프로세스는 전용 메시지 회신 큐를 사용해 결과를 애플리케이션 논리에 다시 전달할 수 있습니다. 애플리케이션 논리는 이러한 결과를 원래 메시지와 상관시킬 수 있어야 합니다. 이 시나리오는 비동기 메시징 입문서에 자세히 설명되어 있습니다.

  • 메시징 시스템의 크기 조정. 대규모 솔루션에서 단일 메시지 큐는 메시지 수가 갑자기 증가하여 시스템에서 병목 현상을 일으킬 수 있습니다. 이 상황에서는 메시징 시스템을 분할해 메시지를 특정 생산자에서 특별한 큐로 보내거나 부하 분산을 사용해 여러 메시지 큐에 메시지를 분산시키는 것이 좋습니다.

  • 메시징 시스템의 안정성 보장. 애플리케이션이 메시지를 큐에 넣은 후에 메시지가 손실되지 않도록 보장하려면 신뢰할 수 있는 메시징 시스템이 필요합니다. 이 시스템은 모든 메시지가 한 번 이상 전달되도록 하기 위해 필요합니다.

이 패턴을 사용해야 하는 경우

다음 경우에 이 패턴을 사용합니다.

  • 애플리케이션의 워크로드가 비동기적으로 실행할 수 있는 작업으로 분할된 경우
  • 작업이 독립적이고 동시에 실행할 수 있는 경우
  • 작업의 양이 너무 가변적이어서 확장 가능한 솔루션이 필요한 경우
  • 솔루션이 고가용성을 제공해야 하고 작업의 처리가 실패하면 복원되어야 하는 경우

다음의 경우에는 이 패턴이 유용하지 않습니다.

  • 애플리케이션 워크로드를 개별 작업으로 분리하기가 쉽지 않거나 작업 사이의 종속성이 너무 큰 경우
  • 작업을 동기적으로 수행해야 하고, 애플리케이션 논리가 계속하기 전에 작업이 완료될 때까지 기다려야 하는 경우
  • 작업을 특정 순서로 수행해야 하는 경우

일부 메시징 시스템은 생산자가 메시지를 함께 그룹화하고 그룹화한 메시지를 동일한 소비자가 모두 처리할 수 있는 세션을 지원합니다. 이 메커니즘은 우선 순위가 지정된 메시지(지원하는 경우)를 이용해 메시지를 단일 생산자에서 단일 소비자로 순서대로 전달하는 메시지 정렬의 형태를 구현하는 데 사용할 수 있습니다.

워크로드 디자인

설계자는 Azure Well-Architected Framework 핵심 요소에서 다루는 목표와 원칙을 해결하기 위해 워크로드 디자인에 경쟁 소비자 패턴을 사용하는 방법을 평가해야 합니다. 예시:

핵심 요소 이 패턴으로 핵심 목표를 지원하는 방법
안정성 디자인 결정은 워크로드가 오작동에 대한 복원력을 갖도록 하고 오류가 발생한 후 완전히 작동하는 상태로 복구 되도록 하는 데 도움이 됩니다. 이 패턴은 소비자를 복제본으로 처리하여 큐 처리에서 중복성을 구축하므로 인스턴스 오류로 인해 다른 소비자가 큐 메시지를 처리하지 못하게 됩니다.

- RE:05 중복성
- RE:07 백그라운드 작업
비용 최적화는 워크로드의 투자 수익률유지 및 개선하는 데 초점을 맞춥니다. 이 패턴은 큐가 비어 있을 때 큐 깊이를 기반으로 하는 크기를 0으로 줄여 비용을 최적화하는 데 도움이 될 수 있습니다. 동시 소비자 인스턴스의 최대 수를 제한할 수 있도록 하여 비용을 최적화할 수도 있습니다.

- CO:05 속도 최적화
- CO:07 구성 요소 비용
성능 효율성은 크기 조정, 데이터, 코드의 최적화를 통해 워크로드가 수요를 효율적으로 충족하는 데 도움이 됩니다. 모든 소비자 노드에 부하를 분산하면 큐 깊이에 따라 사용률 및 동적 크기 조정이 증가하여 오버프로비전이 최소화됩니다.

- PE:05 크기 조정 및 분할
- PE:07 코드 및 인프라

디자인 결정과 마찬가지로 이 패턴을 통해 도입 가능한 다른 핵심 요소의 목표에 관한 절충을 고려합니다.

예시

Azure는 이 클라우드 디자인 패턴의 직접 구현인 Service Bus 큐 및 Azure 함수 큐 트리거를 제공합니다. Azure Functions는 트리거 및 바인딩을 통해 Azure Service Bus와 통합됩니다. Service Bus와 통합하면 게시자가 보낸 큐 메시지를 사용하는 함수를 빌드할 수 있습니다. 게시 애플리케이션은 큐에 메시지를 게시하고, Azure Functions로 구현된 소비자는 이 큐에서 메시지를 검색하고 처리할 수 있습니다.

복원력을 위해 Service Bus 큐를 사용하면 소비자가 큐에서 메시지를 검색할 때 PeekLock 모드를 사용할 수 있습니다. 이 모드는 실제로 메시지를 제거하지 않고 단순히 다른 소비자로부터 숨깁니다. Azure Functions 런타임은 PeekLock 모드에서 메시지를 받습니다. 함수가 완료되면 메시지에서 Complete를 호출하거나, 함수가 실패하면 Abandon를 호출할 수 있으며 메시지가 다시 표시되어 다른 소비자가 메시지를 검색할 수 있습니다. 함수가 PeekLock 시간 제한보다 오래 실행되는 경우 함수가 실행되면 잠금이 자동으로 갱신됩니다.

Azure Functions는 큐의 깊이에 따라 스케일 아웃/스케일 인할 수 있으며, 모두 큐의 경쟁 소비자 역할을 합니다. 함수의 여러 인스턴스가 만들어지면 메시지를 독립적으로 끌어와서 처리하는 방식으로 모두 경쟁합니다.

Azure Service Bus 큐 사용에 대한 자세한 내용은 Service Bus 큐, 토픽 및 구독을 참조하세요.

큐 트리거 Azure Functions에 대한 자세한 내용은 Azure Functions에 대해 Azure Service Bus 트리거를 참조하세요.

.NET용 Azure Service Bus 클라이언트 라이브러리를 사용하여 Service Bus 큐에 메시지를 보내는 방법을 보려면 게시된 예제를 참조하세요.

다음 단계

  • 비동기 메시징 입문. 메시지 큐는 비동기 통신 메커니즘입니다. 소비자 서비스가 회신을 애플리케이션에 전송해야 하는 경우 특정 형태의 응답 메시징을 구현해야 할 수 있습니다. 비동기 메시징 입문서에서는 메시지 큐를 사용하여 요청/회신 메시징을 구현하는 방법에 대한 정보를 제공합니다.

  • 자동 크기 조정 지침. 애플리케이션이 메시지를 게시하는 큐의 길이가 변하기 때문에 소비자 서비스 인스턴스를 시작하고 중지할 수 있습니다. 자동 크기 조정은 최대 처리 시간 동안 처리량을 유지하는 데 도움을 줄 수 있습니다.

이 패턴을 구현할 때 다음 패턴 및 지침도 관련이 있을 수 있습니다.

  • 컴퓨팅 리소스 통합 패턴. 비용과 관리 오버헤드를 줄이기 위해 소비자 서비스의 여러 인스턴스를 단일 프로세스에 통합할 수 있습니다. 컴퓨팅 리소스 통합 패턴에서 이 방법에 따른 장점과 단점을 설명합니다.

  • 큐 기반 부하 평준화 패턴. 메시지 큐를 도입하면 시스템에 복원력을 추가해 서비스 인스턴스가 애플리케이션 인스턴스에서 전송하는 광범위한 요청을 처리할 수 있습니다. 메시지 큐는 버퍼로 작용해 부하를 평준화합니다. 큐 기반 부하 평준화 패턴에서 이 시나리오를 자세히 설명합니다.