次の方法で共有


Azure 上の AI ワークロード

このガイダンス 、非決定論的な機能、データとアプリケーションの設計、および操作に重点を置いて、AI ワークロードの設計に関するアーキテクチャ上の課題について説明します。 推奨事項は、Azure Well-Architected Framework (WAF) の原則に基づいており、成功した Azure 実装からの分析情報が含まれています。

これらの記事は、ワークロード所有者アーキテクト、開発リーダー、IT リーダーなどの技術関係者を対象としています。 さまざまな役割とチーム間のコラボレーションが重要な側面であるため、データ サイエンティストなどの特殊な AI とデータ ロールも、このガイダンスに注意する必要があります。

Note

Microsoft Azure には、ワークロードに統合したり、ワークロードを中心に構築したりできるさまざまな AI サービスが用意されています。 ビジネス ニーズに応じて、フル マネージド SaaS ソリューション、PaaS ソリューション、または独自の AI ソリューションの構築を選択できます。 ここでは、特定の Azure サービスとその機能については説明しません。 これらの場合は、それぞれの製品ドキュメントを参照することをお勧めします。

また、次のような特定の AI ワークロードはスコープ内にありません。

  • Microsoft Copilot Studio などの低コードおよびコードなしのオファリングによって実現されるワークロード。
  • ハイ パフォーマンス コンピューティングを必要とするワークロード。
  • 生成型または差別的な AI ユース ケースを実装していないワークロード。

AI ワークロードとは

WAF のコンテキストでは、AI ワークロードは予測タスク、判別タスク、または生成タスクのニーズを満たします。 倫理的な機能に焦点を当て、進化の速い AI テクノロジに適応し、関連性と説明性を維持します。 WAF の柱は、システムが信頼性が高く、セキュリティで保護され、効率的で、コスト効率が高いかどうかを確認するために、すべての決定ポイントで適用する必要があります。

AI ワークロードは、ワークロードの一部の決定論的機能を、固定の結果が実用的でない状況で解決する非決定論的な動作に置き換えるため、従来のワークロードとは異なります。 代わりに、コードとデータをエンティティまたは モデルに結合し、従来のシステムでは提供できない独自のエクスペリエンスを実現します。

設計戦略を開始する前に、まずこれらの重要な点を考慮してください。

モデルの幅広いカテゴリについて理解する

  • 生成 AI は機械学習を使用して、自律的に新しいコンテンツを作成します。 これには、ユーザー データを使用してカスタマイズしたり、Azure OpenAI などのサービスとして使用したりできる言語モデルが含まれています。 たとえば、言語モデルの一種である GPT は、人間の会話言語の模倣に特化しており、チャットや自然言語のエクスペリエンスに最適です。

    ユース ケース: Generateive AI は、記事、ストーリー、アートを生成し、合成データを生成してデータセットのバランスを取り、チャットボットをより人間に似たものにすることができます。

  • 判別 AI では、明示的なプログラミングを使用して、ルールとアルゴリズムに基づいて特定のタスクを実行します。 次のように分割できます。

    • モデルベース。 以前の観察から実行されたトレーニングに基づいてパターンを見つけて予測を行うが、新しいコンテンツを作成したり、独自に適応したりできない予測システム。

    • モデルベース以外の。 事前に定義されたルールに従って、ビデオ ゲームのキャラクターなどのシステムと対話する自律エージェント。

    ユース ケース: 識別 AI は、予測分析、レコメンデーション システム、不正行為の検出に使用されます。

この一連の記事では、必要に応じて言語モデルなどの特定の種類に焦点を当て、さまざまな AI ワークロードについて説明します。

重要

生成モデルと判別モデルのどちらを選択する場合も、実行する必要があるタスクについて考えてください。 生成モデルでは新しいデータが作成されますが、判別モデルでは特徴に基づいて既存のデータが分類されます。 分類タスクまたは回帰タスクの場合は、ジョブに適合するモデルを選択します。 たとえば、分類できる言語モデルは、分類のみを行う言語モデルよりも汎用性が高い場合があります。

ビルドと購入のオプションを評価する

一般的な応答が許容される場合は、事前構築済みのモデルまたは不透明な処理を使用する AI サービス ベースのソリューションで、ワークロードに十分である必要があります。 ただし、ビジネスに固有のデータが必要な場合や、コンプライアンス要件がある場合は、カスタム モデルを作成する必要があります。

カスタム モデル、事前構築済みモデル、またはサービスのいずれかを選択する場合は、次の要因を考慮してください。

  • データ コントロール。 カスタム モデルを使用すると、機密データをより詳細に制御できます。 事前構築済みモデルは、一般的なタスクに対して簡単です。

  • カスタマイズ。 カスタム モデルは、固有のニーズに適しています。 事前構築済みモデルでは、柔軟性が欠ける可能性があります。

  • コストと維持。 カスタム モデルには、継続的なメンテナンスとリソースが必要です。 事前構築済みモデルでは、通常、初期コストが低く、インフラストラクチャの負担が少なくなります。

  • パフォーマンス。 事前構築済みサービスは、最適化されたインフラストラクチャとスケーラビリティを提供します。 待ち時間の短いニーズやスケーラビリティの高いニーズに最適です。

  • 専門知識。 カスタム モデルには熟練したチームが必要です。 事前構築済みのモデルは、デプロイが迅速になり、専門知識が限られている場合に簡単に使用できます。

重要

独自のモデルを作成して維持するには、多くのリソース、時間、専門知識が必要です。 決める前に十分に研究することが重要です。 通常、事前構築済みのモデルまたはマネージド サービスを選択することをお勧めします。

一般的な課題とは

  • コンピューティング コスト。 AI 関数はコンピューティングニーズが高いためコストがかかる場合があり、コンピューティングのニーズはワークロードの設計によって異なる場合があります。 要件を理解し、コストを管理するための適切なサービスを選択します。

  • セキュリティとコンプライアンスの要件。 既製のソリューションは、セキュリティとコンプライアンスのニーズを満たしていない可能性があります。 不要な負担を回避するための研究オプション。

  • データの量。 さまざまな形式で大量のデータを処理する場合、機密情報を保護し、効率的な処理を行うという課題が伴います。 ストレージ、処理、転送のコストを最適化することは、継続的なアクティビティである必要があります。

  • モデルの減衰。 モデルは時間の経過と同時に低下し、結果が不正確になることがあります。 AI システムのテストは、そのランダム性のために困難です。

  • スキルの課題。 新しい AI ワークロードには、広範なトレーニングを必要とする特殊なロールと新しい運用プロセスが必要になる場合があります。

  • AI イノベーションのペース。 最新のテクノロジを採用することは、最先端に留まりたくなる可能性があります。 新しいテクノロジを慎重に評価して、ユーザー エクスペリエンスを向上させ、最新の状態を保つためだけに複雑さを加えないようにします。

  • 倫理的要件。 ユース ケースが AI の倫理的なターゲットであるかどうかを明確に判断する必要があります。 責任あるシステムを構築するためには、計画と実装のフェーズ全体を通じて倫理基準を維持する必要があります。

このガイダンスを使用する方法

設計手法から始めます。ここでは技術的および運用的な領域における根拠と繰り返されるテーマを概説しています。 この体系的なアプローチは、要件と設計戦略を定義するのに役立ちます。 不確実な選択に直面したときには、ワークロードの全体的な目標に沿った状態を維持するためにこの手法を再検討してください。 また、技術的な決定を正当化し、継続的な改善のために顧客のフィードバックを組み込むために、利害関係者と共同作業するためのフレームワークも提供します。

設計原則の に進み 成長の進化を考慮して、設計手法が主要なウェルアーキテクト フレームワークの柱にどのように適合しているかを確認します。 すべての柱の基礎となる原則を、トレードオフも含めて総合的に評価します。

ソリューションに最も大きな影響を与える 設計領域 に焦点を当てます。 各領域には、設計の意思決定を導くための考慮事項と推奨事項が含まれています。

Assessment Review Tool を使用して、運用環境での最適化された AI ワークロードの準備状況を評価します。

一般的なアーキテクチャ パターンと設計領域

図は、AI ワークロードの一般的なアーキテクチャ パターンを示しています。

このアーキテクチャでは、さまざまなコンポーネントの統合が強調され、AI 駆動型ソリューションでの効率的なデータ処理、モデルの最適化、リアルタイムアプリケーションのデプロイが可能になります。 これには、データ ソース、データ処理、モデル トレーニング、モデルのデプロイ、ユーザー インターフェイスなどのさまざまなモジュールが含まれており、初期収集から最終的なユーザー操作まで、データがシステムを通過する方法を示します。

次の表では、そのパターンに関連するいくつかの主要な設計領域について説明します。

設計領域
アプリケーションの設計。 既存のアプリケーション設計標準に大きな影響を与える可能性がある AI ワークロード固有の考慮事項について説明します。
アプリケーション プラットフォーム。 モデルのホスティング、モデル トレーニング、推論など、AI ワークロード機能をサポートするために使用する最適なプラットフォームを決定します。
トレーニング データの設計。 モデル トレーニング データを処理するためのデータ インジェスト、前処理、保持、ガバナンスに関するトピックの設計戦略。
グラウンド データ設計。 検索可能性と取得を最適化し、基礎データのセキュリティとコンプライアンスの要件を満たす設計戦略。
データ プラットフォーム。 ワークロードで使用される大量および潜在的に多くの形式のデータを処理するための最適なホスティング プラットフォームを決定します。
機械学習操作と生成 AI 操作。 機械学習または生成 AI の機能とシステムをサポートするための最新の DevOps プラクティスを確立します。
ワークロード操作。 新しいアプローチで運用プラクティスを最新化し、特殊な役割とトレーニングを追加します。
テストと評価。 AI ワークロードを対象としたメトリックを使用して、精度、精度、感度、特定性などの特性を測定するためのテストと評価の戦略を開発します。
ワークロード ペルソナ。 ペルソナが AI ワークロードの完全なライフサイクルにどのように関与しているかを理解して、チームが構築とサポートを完全に行うことができるようにします。
責任ある AI。 AI は、新しい製品やサービスに素晴らしい機会をもたらしますが、かなりのリスクも伴います。 AI ソリューションを一般に公開する場合のユーザー エクスペリエンスと倫理的な影響に特に注意してください。

ヒント

すべてのアーキテクチャ上の決定には、さまざまな考慮事項と、フレームワークのさまざまな側面のバランスを取る一連の認識された妥協点が伴います。 これらのトレードオフは、このアイコン によって示されます。

次のステップ