次の方法で共有


AKS クラスターからの送信接続の基本的なトラブルシューティング

この記事では、Microsoft Azure Kubernetes Service (AKS) クラスターからの送信接続の基本的なトラブルシューティングを行い、障害のあるコンポーネントを特定する方法について説明します。

前提条件

  • Kubernetes kubectl ツール、またはクラスターに接続するための同様のツール。 Azure CLI を使用して kubectl をインストールするには、az aks install-cli コマンドを実行します。

  • パッケージを処理するための apt-get コマンドライン ツール。

  • クライアント URL (cURL) ツール、または同様のコマンド ライン ツール。

  • DNS 解決を確認するための nslookup コマンド ライン (dnsutils) ツール。

Azure Kubernetes Service の送信トラフィックのシナリオ

AKS クラスター内から送信されたトラフィックは、ポッドまたはワーカー ノードのいずれからのトラフィックであっても、クラスターからの送信トラフィックと見なされます。 AKS クラスターの送信フローに問題がある場合はどうしますか? トラブルシューティングを行う前に、まず送信トラフィック フローのシナリオを確認してください。

AKS クラスターからの送信トラフィックは、次のカテゴリに分類できます。

  1. 同じクラスター内のポッドまたはサービスへのトラフィック (内部トラフィック)

  2. 同じ仮想ネットワーク内のデバイスまたはエンドポイント、または仮想ネットワーク ピアリングを使用する別の仮想ネットワークへのトラフィック。

  3. VPN 接続または Azure ExpressRoute 接続を介したオンプレミス環境へのトラフィック。

  4. Azure Load Balancer 経由の AKS ネットワーク外のトラフィック (パブリック送信トラフィック)

  5. Azure Firewall またはプロキシ サーバー (パブリック送信トラフィック) 経由の AKS ネットワーク外のトラフィック

内部トラフィック

AKS クラスターからの内部トラフィックの基本的な要求フローは、次の図に示すフローに似ています。

AKS クラスターからの内部トラフィックの基本的な要求フローの図。

Azure Load Balancer を介したパブリック送信トラフィック

トラフィックがインターネット上の宛先の場合、既定の方法は Azure Load Balancer 経由でトラフィックを送信することです。

AKS クラスターから Azure Load Balancer を経由する外部インターネット トラフィックの要求フローの図。

Azure Firewall またはプロキシ サーバーを介したパブリック送信トラフィック

場合によっては、エグレス トラフィックをフィルター処理する必要があり、Azure Firewall が必要になる場合があります。

AKS クラスターから Azure Firewall を経由する外部インターネット トラフィックの要求フローの図。

ユーザーは、ファイアウォールではなくプロキシ サーバーを追加したり、エグレス トラフィック用の NAT ゲートウェイを設定したりできます。 基本的なフローは、図に示すように変わりません。

トラブルシューティングを続行できるように、クラスターのエグレス フローの性質を理解することが重要です。

トラブルシューティングの際の考慮事項

エグレス デバイスを確認する

AKS で送信トラフィックのトラブルシューティングを行う場合は、エグレス デバイス (つまり、トラフィックが通過するデバイス) を把握することが重要です。 ここでは、エグレス デバイスは次のいずれかのコンポーネントになります。

  • Azure Load Balancer
  • Azure Firewall またはカスタム ファイアウォール
  • ネットワーク アドレス変換 (NAT) ゲートウェイ
  • プロキシ サーバー

また、フローは宛先によって異なる場合もあります。 たとえば、内部トラフィック (つまり、クラスター内) はエグレス デバイスを経由しません。 内部トラフィックでは、クラスター ネットワークのみが使用されます。 パブリック送信トラフィックの場合は、エグレス デバイスが通過しているかどうかを判断し、そのデバイスを確認します。

トラフィック フロー内の各ホップを確認する

エグレス デバイスを特定した後、次の要因を確認します。

  • 要求のソースと宛先。

  • ソースと宛先の間にホップインします。

  • 要求/応答フロー。

  • 次のレイヤーなど、追加のセキュリティ層によって強化されるホップ。

    • ファイアウォール
    • ネットワーク セキュリティ グループ (NSG)
    • ネットワーク ポリシー

問題のあるホップを識別するには、応答コードの前後を確認します。 パケットが特定のホップで正しく到着するかどうかを確認するには、パケット キャプチャを続行できます。

HTTP 応答コードを確認する

各コンポーネントを確認するときは、HTTP 応答コードを取得して分析。 これらのコードは、問題の性質を特定するのに役立ちます。 このコードは、アプリケーションが HTTP 要求に応答するシナリオで特に役立ちます。

クライアントとサーバーからパケット キャプチャを取得する

他のトラブルシューティング手順で決定的な結果が得られない場合は、クライアントとサーバーからパケット キャプチャを実行します。 パケット キャプチャは、クライアントとサーバーの間に HTTP 以外のトラフィックが関係している場合にも役立ちます。 AKS 環境のパケット キャプチャを収集する方法の詳細については、データ収集ガイドの次の記事を参照してください。

トラブルシューティングのチェックリスト

AKS クラスターからのエグレス トラフィックの基本的なトラブルシューティングについては、次の手順に従います。

  1. ドメイン ネーム システム (DNS) 解決がエンドポイントに対して正しく機能することを確認します。

  2. IP アドレスを介してエンドポイントに到達できることを確認します。

  3. 別のソースからエンドポイントに到達できることを確認します

  4. そのエンドポイントが動作中であることを確認します。

  5. クラスターが他の外部エンドポイントに到達できるかどうかを確認します。

  6. ネットワーク ポリシーがトラフィックをブロックしているかどうかを確認します。

  7. NSG がトラフィックをブロックしているかどうかを確認します。

  8. ファイアウォールまたはプロキシがトラフィックをブロックしているかどうかを確認します。

  9. AKS サービス プリンシパル ID またはマネージド ID に、Azure リソースへのネットワーク変更を行うために必要な AKS サービスのアクセス許可 があるかどうかを確認します。

Note

基本的なトラブルシューティングを行うときは、サービス メッシュがないことを前提としています。 Istio などのサービス メッシュを使用すると、TCP ベースのトラフィックに対して通常とは異なる結果が生成されます。

ポッドとノードがエンドポイントに到達できるかどうかを確認する

ポッド内から、エンドポイントへの DNS 参照を実行できます。

kubectl exec コマンドを実行してポッドに接続し、DNS Utils パッケージをインストールできない場合はどうしましょう。 そのようなときは、問題のあるポッドと同じ名前空間でテスト ポッドを開始し、テストを実行できます。

Note

DNS 解決またはエグレス トラフィックで必要なネットワーク パッケージをインストールできない場合は、rishasi/ubuntu-netutil:1.0 Docker イメージを使用できます。 このイメージには、必要なパッケージが既にインストールされています。

Linux ポッドの DNS 解決を確認する手順の例
  1. 問題のあるポッドと同じ名前空間でテスト ポッドを開始します。

    kubectl run -it --rm aks-ssh --namespace <namespace> --image=debian:stable --overrides='{"spec": { "nodeSelector": {"kubernetes.io/os": "linux"}}}'
    

    テスト ポッドが稼働した後、そのポッドにアクセスできるようになります。

  2. 次の apt-get コマンドを実行して、他のツール パッケージをインストールします。

    # Update and install tool packages
    apt-get update && apt-get install -y dnsutils curl
    
  3. パッケージがインストールされたら、nslookup コマンドを実行して、エンドポイントへの DNS 解決をテストします。

    $ nslookup microsoft.com # Microsoft.com is used as an example
    Server:         <server>
    Address:        <server IP address>#53
    ...
    ...
    Name:   microsoft.com
    Address: 20.53.203.50
    
  4. アップストリームの DNS サーバーから直接 DNS 解決を試します。 この例では、Azure DNS を使います。

    $ nslookup microsoft.com 168.63.129.16
    Server:         168.63.129.16
    Address:        168.63.129.16#53
    ...
    ...
    Address: 20.81.111.85
    

場合によっては、クラスター DNS ではなくエンドポイント自体に問題があります。 このような場合は、次のチェックを検討してください。

  1. 目的のポートがリモート ホストで開かれているかどうかを確認します。

    curl -Ivm5 telnet://microsoft.com:443
    
  2. HTTP 応答コードを確認します。

    curl -Ivm5 https://microsoft.com
    
  3. 他のエンドポイントに接続できるかどうかを確認します。

    curl -Ivm5 https://kubernetes.io
    

問題のあるポッドが存在するノードからエンドポイントに到達可能であることを確認し、DNS 設定を確認するには、次の手順に従います。

  1. デバッグ ポッドを使用して、問題のあるポッドがあるノードを入力します。 これを行う方法の詳細については、「 メンテナンスまたはトラブルシューティングのために Azure Kubernetes Service (AKS) クラスター ノードに接続するを参照してください。

  2. エンドポイントへの DNS 解決をテストします。

    $ nslookup  microsoft.com
    Server:         168.63.129.16
    Address:        168.63.129.16#53
    
    Non-authoritative answer:
    Name:   microsoft.com
    Address: 20.112.52.29
    Name:   microsoft.com
    Address: 20.81.111.85
    Name:   microsoft.com
    Address: 20.84.181.62
    Name:   microsoft.com
    Address: 20.103.85.33
    Name:   microsoft.com
    Address: 20.53.203.50
    
  3. resolv.conf ファイルを調べて、必要なネーム サーバーが追加されているかどうかを確認します。

    cat /etc/resolv.conf
    cat /run/systemd/resolve/resolv.conf
    
Windows ポッドの DNS 解決を確認する手順の例
  1. Windows ノード プールでテスト ポッドを実行します。

    # For a Windows environment, use the Resolve-DnsName cmdlet.
    kubectl run dnsutil-win --image='mcr.microsoft.com/windows/servercore:ltsc2022' --overrides='{"spec": { "nodeSelector": {"kubernetes.io/os": "windows"}}}' -- powershell "Start-Sleep -s 3600"
    
  2. kubectl exec コマンドを実行し、PowerShell を使ってポッドに接続します。

    kubectl exec -it dnsutil-win -- powershell
    
  3. PowerShell で Resolve-DnsName コマンドレットを実行して、エンドポイントに対する DNS 解決が機能しているかどうかを調べます。

    PS C:\> Resolve-DnsName www.microsoft.com 
    
    Name                           Type   TTL   Section    NameHost
    ----                           ----   ---   -------    --------
    www.microsoft.com              CNAME  20    Answer     www.microsoft.com-c-3.edgekey.net
    www.microsoft.com-c-3.edgekey. CNAME  20    Answer     www.microsoft.com-c-3.edgekey.net.globalredir.akadns.net
    net
    www.microsoft.com-c-3.edgekey. CNAME  20    Answer     e13678.dscb.akamaiedge.net
    net.globalredir.akadns.net
    
    Name       : e13678.dscb.akamaiedge.net 
    QueryType  : AAAA
    TTL        : 20
    Section    : Answer
    IP6Address : 2600:1408:c400:484::356e   
    
    
    Name       : e13678.dscb.akamaiedge.net 
    QueryType  : AAAA
    TTL        : 20
    Section    : Answer
    IP6Address : 2600:1408:c400:496::356e 
    
    
    Name       : e13678.dscb.akamaiedge.net
    QueryType  : A
    TTL        : 12
    Section    : Answer
    IP4Address : 23.200.197.152
    

DNS 解決を伴う 1 つの異常なシナリオでは、DNS クエリはノードから正しい応答を取得しますが、ポッドから失敗します。 このシナリオでは、ポッド内から DNS 解決エラーをチェック 、ワーカー ノードからはチェックしないことを検討してください。 クラスター全体のエンドポイントの DNS 解決を検査する場合は、クラスター全体で DNS 解決の状態 チェックすることを検討できます

DNS 解決が成功した場合は、ネットワーク テストに進みます。 それ以外の場合は、クラスターの DNS 構成を確認します。

サードパーティのお問い合わせ窓口に関する免責事項

サードパーティのお問い合わせ窓口に関する情報は、ユーザーの便宜のために提供されているものであり、 この連絡先情報は、予告なしに変更される可能性があります。 マイクロソフトは、掲載されている情報に対して、いかなる責任も負わないものとします。

お問い合わせはこちらから

質問がある場合やヘルプが必要な場合は、サポート要求を作成するか、Azure コミュニティ サポートにお問い合わせください。 Azure フィードバック コミュニティに製品フィードバックを送信することもできます。