高可用性、スケーリング、メモリ使用量のブローカー設定を構成する

[アーティクル]
11/21/2024

Broker リソースは、MQTT ブローカーの全体的な設定を定義するメインリソースです。また、フロントエンドやバックエンドなど、"ブローカー" 構成を実行するポッドの数と種類も決定します。 Broker リソースを使用して、そのメモリプロファイルを構成することもできます。自己復旧メカニズムはブローカーに組み込まれており、多くの場合、コンポーネントの障害から自動的に復旧できます。たとえば、高可用性のために構成された Kubernetes クラスターでノードが失敗するとします。

フロントエンドレプリカとバックエンドパーティションを追加することで、MQTT ブローカーを水平方向にスケーリングできます。フロントエンドレプリカは、クライアントからの MQTT 接続を受け入れ、バックエンドパーティションに転送する役割を担います。バックエンドパーティションは、メッセージを格納してクライアントに配信する役割を担います。フロントエンドポッドはバックエンドポッド間にメッセージトラフィックを分散し、バックエンド冗長係数によって、クラスター内のノード障害に対する回復性を提供するデータコピーの数が決まります。

利用可能な設定の一覧については、Broker API リファレンスを参照してください。

スケーリング設定を構成する

重要

この設定では、ブローカーリソースを変更する必要があり、Azure CLI または Azure portal を使用して初期デプロイ時にのみ構成できます。 "ブローカー" 構成の変更が必要な場合は、新しいデプロイが必要です。詳細については、既定のブローカーのカスタマイズに関する記事を参照してください。

MQTT ブローカーのスケーリング設定を構成するには、Azure IoT Operations デプロイ中、ブローカーリソースの仕様でカーディナリティ フィールドを指定します。

自動デプロイのカーディナリティ

デプロイ時に初期カーディナリティを自動的に判断するには、ブローカーリソースのカーディナリティフィールドを省略します。

ポータル
Azure CLI

Azure portal を使用して Azure IoT Operations をデプロイする場合、自動カーディナリティはまだサポートされていません。ただし、クラスターデプロイモードは、単一ノードまたはマルチノードとして手動で指定することはできます。詳細については、Deploy Azure IoT Operations の展開に関するページを参照してください。

Azure portal で単一ノードまたはマルチノードの設定を選択する場所を示すスクリーンショット。

Azure Resource Manager microsoft.iotoperations/instances/brokers リソースの必要なプロパティを含む JSON 形式のブローカー構成ファイルを準備し、cardinality フィールドを省略します。たとえば、メモリプロファイルのみを設定します。

{
  "memoryProfile": "<MEMORY_PROFILE>"
}

次に、次のコマンドのように、az iot ops create コマンドを --broker-config-file フラグと共に使用して、Azure IoT Operations をデプロイします (簡潔にするために他のパラメーターは省略されています)。

az iot ops create ... --broker-config-file <FILE>.json

詳細については、高度な MQTT ブローカー構成の Azure CLI サポートに関する記事を参照してください。

MQTT ブローカーオペレーターは、デプロイ時に使用可能なノードの数に基づいて、適切な数のポッドを自動的にデプロイします。これは、高可用性やスケールが不要な非運用シナリオの場合に役立ちます。

ただし、これは自動スケーリングではありません。オペレーターは、負荷に基づいてポッドの数を自動的にスケーリングしません。オペレーターは、クラスターハードウェアに基づいてデプロイするポッドの初期数のみを決定します。前述のように、カーディナリティは初期デプロイ時にのみ設定できます。カーディナリティ設定を変更する必要がある場合は、新しいデプロイが必要です。

カーディナリティを直接構成する

カーディナリティ設定を直接構成するには、各カーディナリティフィールドを指定します。

ポータル
Azure CLI

Azure IoT Operations をデプロイするためのガイドに従う場合は、[構成] セクションで [MQTT ブローカーの構成] を確認します。ここで、フロントエンドレプリカ、バックエンドパーティション、およびバックエンドワーカーの数を指定できます。

Azure portal でブローカーのカーディナリティを直接構成する場所を示すスクリーンショット。

az iot ops create コマンドを使用して Azure IoT Operations をデプロイする場合、--broker-frontend-replicas、--broker-frontend-workers、--broker-backend-part、--broker-backend-rf、および --broker-backend-workers パラメーターを使用してカーディナリティ設定を指定します。

たとえば、1 つのフロントエンドレプリカ、1 つのフロントエンドワーカー、1 つのバックエンドパーティション、パーティションごとに 2 つのバックエンドレプリカ、およびレプリカごとに 1 つのバックエンドワーカーを指定するには、次のコマンドを参照してください (簡潔にするために他のパラメーターは省略されています)。

az iot ops create ... --broker-frontend-replicas 1 --broker-frontend-workers 1  --broker-backend-part 1  --broker-backend-workers 1 --broker-backend-rf 2

または、--broker-config-file フラグを使用して、カーディナリティ設定を含む JSON ファイルを指定します。同じ設定の JSON ファイルの例を次に示します。

{
  "cardinality": {
    "frontend": {
      "replicas": 1,
      "workers": 1
    },
    "backendChain": {
      "partitions": 1,
      "redundancyFactor": 2,
      "workers": 1
    }
  }
}

az iot ops create ... --broker-config-file <FILE>.json

カーディナリティについて

カーディナリティは、セット内にある特定のエンティティのインスタンス数を意味します。 MQTT ブローカーのコンテキストでは、カーディナリティは、デプロイするフロントエンドレプリカ、バックエンドパーティション、バックエンドワーカーの数を意味します。カーディナリティ設定は、ブローカーの水平方向のスケーリング、およびポッドまたはノードの障害が発生した場合の高可用性の改善に使用されます。

カーディナリティフィールドは入れ子になったフィールドで、フロントエンドと backendChain のサブフィールドが含まれます。このサブフィールドそれぞれに独自の設定があります。

フロントエンド

フロントエンドサブフィールドでは、フロントエンドポッドの設定を定義します。主な設定は次の 2 つです。

レプリカ: デプロイするフロントエンドレプリカ (ポッド) の数。フロントエンドポッドの 1 つが失敗した場合に備えて、フロントエンドレプリカの数を増やすと高可用性を実現できます。
ワーカー: レプリカあたりの論理フロントエンドワーカーの数。各ワーカーが消費できる CPU コアは最大 1 つです。

バックエンドチェーン

バックエンドチェーンサブフィールドでは、バックエンドパーティションの設定を定義します。主な設定は次の 3 つです。

パーティション: デプロイするパーティションの数。 シャーディングと呼ばれるプロセスを通じて、各パーティションはメッセージの一部をトピック ID とセッション ID で割って処理します。フロントエンドポッドは、パーティション間でメッセージトラフィックを分散します。パーティションの数を増やすと、ブローカーが処理できるメッセージの数が増えます。
冗長性係数: パーティションあたりのデプロイするバックエンドレプリカ (ポッド) の数。冗長性係数を大きくすると、データコピーの数が増加し、クラスター内のノード障害に対する回復性を提供することができます。
ワーカー: バックエンドレプリカあたりのデプロイするワーカーの数。バックエンドレプリカあたりのワーカー数を増やすと、バックエンドポッドで処理できるメッセージの数が増える場合があります。各ワーカーは最大 2 つの CPU コアを消費するため、レプリカあたりのワーカー数を増やしてクラスター内の CPU コアの数を超えないように注意してください。

考慮事項

カーディナリティの値を増やすと、一般的にはより多くの接続とメッセージを処理するブローカーの容量が向上し、ポッドまたはノードの障害が発生した場合の高可用性が向上します。ただし、これにより、リソースの消費量も増加します。そのため、カーディナリティ値を調整するときは、メモリプロファイルの設定とブローカーの CPU リソース要求を検討してください。フロントエンドレプリカあたりのワーカー数を増やすと、フロントエンドの CPU 使用率がボトルネックであることがわかった場合に、CPU コアの使用率を高めるのに役立ちます。バックエンドワーカーの数を増やすと、バックエンド CPU がボトルネックである場合のメッセージのスループットに役立ちます。

たとえば、クラスターに 3 つのノードがあり、それぞれが 8 つの CPU コアを持つ場合は、ノードの数 (3) に合わせてフロントエンドレプリカの数を設定し、ワーカーの数を 1 に設定します。ノードの数 (3) に合わせてバックエンドパーティションの数を設定し、バックエンドワーカーを 1 に設定します。必要に応じて冗長性係数を設定します (2 または 3)。フロントエンド CPU がボトルネックであることがわかった場合は、フロントエンドワーカーの数を増やします。バックエンドとフロントエンドのワーカーは、CPU リソースの確保を求めて、お互いに、および他のポッドと競合する可能性があることに注意してください。

メモリプロファイルを構成する

重要

MQTT ブローカーのメモリプロファイル設定を構成するには、Azure IoT Operations デプロイ中、ブローカーリソースの仕様でメモリプロファイルフィールドを指定します。

ポータル
Azure CLI

Azure IoT Operations をデプロイするためのガイドに従う場合は、[構成] セクションで [MQTT ブローカーの構成] の [メモリプロファイル] 設定を確認します。ここでは、ドロップダウンリストの使用可能なメモリプロファイルから選択できます。

az iot ops create コマンドを使用して Azure IoT Operations をデプロイする場合、--broker-mem-profile パラメーターを使用してメモリプロファイル設定を指定します。

たとえば、メモリプロファイルを Tiny として指定するには、次のコマンドを参照してください (簡潔にするために他のパラメーターは省略されています)。

az iot ops create ... --broker-mem-profile Tiny

詳細については、オプションの az iot ops create パラメーターに関するページを参照してください。

メモリ使用量の特性が異なるいくつかのメモリプロファイルから選択できます。

最小

このプロファイルを使用する場合:

各フロントエンドレプリカの最大メモリ使用量は約 99 MiB ですが、実際の最大メモリ使用量は高くなる可能性があります。
各バックエンドレプリカの最大メモリ使用量は、約 102 MiB にバックエンドワーカーの数を乗算しますが、実際の最大メモリ使用量は高くなる可能性があります。

このプロファイルを使用する場合の推奨事項:

使用するフロントエンドは 1 つだけです。
クライアントは大きなパケットを送信しないでください。送信するパケットは 4 MiB 未満にする必要があります。

低

このプロファイルを使用する場合:

各フロントエンドレプリカの最大メモリ使用量は約 387 MiB ですが、実際の最大メモリ使用量は高くなる可能性があります。
各バックエンドレプリカの最大メモリ使用量は、約 390 MiB にバックエンドワーカーの数を乗算しますすが、実際の最大メモリ使用量は高くなる可能性があります。

このプロファイルを使用する場合の推奨事項:

1 つまたは 2 つのフロントエンドのみを使用する必要があります。
クライアントは大きなパケットを送信しないでください。送信するパケットは 10 MiB 未満にする必要があります。

中

Medium は既定のプロファイルです。

各フロントエンドレプリカの最大メモリ使用量は約 1.9 GiB ですが、実際の最大メモリ使用量は高くなる可能性があります。
各バックエンドレプリカの最大メモリ使用量は、約 1.5 GiB にバックエンドワーカーの数を乗算しますすが、実際の最大メモリ使用量は高くなる可能性があります。

高

各フロントエンドレプリカの最大メモリ使用量は約 4.9 GiB ですが、実際の最大メモリ使用量は高くなる可能性があります。
各バックエンドレプリカの最大メモリ使用量は、約 5.8 GiB にバックエンドワーカーの数を乗算しますすが、実際の最大メモリ使用量は高くなる可能性があります。

カーディナリティと Kubernetes リソースの制限

クラスター内のリソース不足を防ぐために、ブローカーは既定で Kubernetes CPU リソース制限を要求するように構成されます。レプリカまたはワーカーの数をスケーリングすると、それに比例して必要な CPU リソースが増加します。クラスターで使用可能な CPU リソースが不足すると、デプロイエラーが発生します。これにより、要求されたブローカーカーディナリティで、最適な実行に必要なリソースが不足するという状況を回避できます。また、潜在的な CPU 競合やポッド削除を防ぐのにも役立ちます。

MQTT ブローカーは現在、フロントエンドワーカーごとに 1 つの (1.0) CPU ユニットと、バックエンドワーカーごとに 2 つの (2.0) CPU ユニットを要求しています。詳細については、Kubernetes CPU リソースユニットに関する記事を参照してください。

たとえば、以下のカーディナリティでは、次の CPU リソースが要求されます。

フロントエンド: フロントエンドポッドあたり 2 CPU ユニット、合計 6 CPU ユニット。
バックエンド: バックエンドポッドあたり 4 CPU ユニット (2 つのバックエンドワーカーの場合)、x 2 (冗長性係数)、x 3 (パーティション数)、合計 24 CPU ユニット。

{
  "cardinality": {
    "frontend": {
      "replicas": 3,
      "workers": 2
    },
    "backendChain": {
      "partitions": 3,
      "redundancyFactor": 2,
      "workers": 2
    }
  }
}

この設定を無効にするには、generateResourceLimits.cpu フィールドを、ブローカーリソースで Disabled に設定します。

ポータル
Azure CLI

generateResourceLimits フィールドの変更は、Azure portal ではサポートされていません。この設定を無効にするには、Azure CLI を使用します。

Azure Resource Manager microsoft.iotoperations/instances/brokers リソースの必要なプロパティを含む JSON 形式のブローカー構成ファイルを準備し、generateResourceLimits.cpu フィールドを Disabled に設定します。次に例を示します。

{
  "generateResourceLimits": {
    "cpu": "Disabled"
  }
}

az iot ops create ... --broker-config-file <FILE>.json

詳細については、高度な MQTT ブローカー構成の Azure CLI サポートに関する記事を参照してください。

マルチノードデプロイ

マルチノードデプロイで高可用性と回復性を確保するために、Azure IoT Operations MQTT ブローカーでは、バックエンドポッド用にアンチアフィニティルールが自動的に設定されます。

これらのルールはあらかじめ定義されており、変更できません。

アンチアフィニティルールの目的

アンチアフィニティルールは、同じパーティションのバックエンドポッドが同じノードで実行されないようにします。これは負荷を分散するのに役立ち、ノード障害に対する回復性を提供します。具体的には、同じパーティションのバックエンドポッドには、お互いにアンチアフィニティがあります。

アンチアフィニティ設定の確認

バックエンドポッドのアンチアフィニティ設定を確認するには、次のコマンドを使用します。

kubectl get pod aio-broker-backend-1-0 -n azure-iot-operations -o yaml | grep affinity -A 15

出力には、次のようなアンチアフィニティ構成が表示されます。

affinity:
  podAntiAffinity:
    preferredDuringSchedulingIgnoredDuringExecution:
    - podAffinityTerm:
        labelSelector:
          matchExpressions:
          - key: chain-number
            operator: In
            values:
            - "1"
        topologyKey: kubernetes.io/hostname
      weight: 100

これらは、ブローカーに設定された唯一のアンチアフィニティルールです。

次のステップ

MQTT ブローカーのリスナーを構成する

次の方法で共有

高可用性、スケーリング、メモリ使用量のブローカー設定を構成する

スケーリング設定を構成する

自動デプロイのカーディナリティ

カーディナリティを直接構成する

カーディナリティについて

フロントエンド

バックエンドチェーン

考慮事項

メモリプロファイルを構成する

最小

低

中

高

カーディナリティと Kubernetes リソースの制限

マルチノードデプロイ

アンチアフィニティルールの目的

アンチアフィニティ設定の確認

次のステップ

フィードバック

その他のリソース

次の方法で共有

高可用性、スケーリング、メモリ使用量のブローカー設定を構成する

スケーリング設定を構成する

自動デプロイのカーディナリティ

カーディナリティを直接構成する

カーディナリティについて

フロントエンド

バックエンド チェーン

考慮事項

メモリ プロファイルを構成する

最小

低

中

高

カーディナリティと Kubernetes リソースの制限

マルチノード デプロイ

アンチアフィニティ ルールの目的

アンチアフィニティ設定の確認

次のステップ

フィードバック

その他のリソース

バックエンドチェーン

メモリプロファイルを構成する

マルチノードデプロイ

アンチアフィニティルールの目的