データ サイエンス仮想マシンに基づくチーム分析と AI 環境
Data Science Virtual Machine (DSVM) では、人工知能 (AI) およびデータ分析用にあらかじめ構築されているソフトウェアで、Azure プラットフォーム上にリッチな環境を提供します。
従来、個々の分析デスクトップとして、DSVM が使用されています。 この共有された事前構築済みの分析環境により、科学者の生産性が向上します。 大規模な分析チームが、データ サイエンティストや AI 開発者向けの環境を計画する場合、繰り返されるテーマの 1 つは、共有開発および実験分析のインフラストラクチャです。 このインフラストラクチャは、データ サイエンス チームと分析チームとの間のコラボレーションと一貫性を促進する、エンタープライズ IT ポリシーに従って管理されます。
共有インフラストラクチャにより、分析環境で IT をさらに有効に活用することができます。 一部の組織は、チームベースのデータ サイエンス/分析インフラストラクチャを "分析サンドボックス" と呼びます。 これにより、データ サイエンティストはさまざまなデータ資産にアクセスし、データを迅速に理解して処理できるようになります。 このサンドボックス環境では、データ サイエンティストが実験を実行し、仮説を検証して、実稼働環境に影響えない予測モデルを構築することもできます。
DSVM は、Azure インフラストラクチャ レベルで動作するため、IT 管理者は、企業の IT ポリシーに準拠して動作する DSVM を簡単に構成できます。 DSVM は、さまざまな共有アーキテクチャを実装する十分な柔軟性を提供し、企業データ資産へのアクセスを制御された方法で提供します。
このセクションでは、チーム ベースのデータ サイエンス インフラストラクチャとして DSVM を展開するために使用できるパターンとガイドラインについて説明します。 これらのパターンの構成要素は、サービスとしての Azure インフラストラクチャ (IaaS) から取得されるため、任意の Azure VM に適用されます。 この一連の記事では、Azure インフラストラクチャのこれらの標準的な機能を DSVM に適用することに注目します。
エンタープライズ チーム分析環境の主要な構成要素には、次が含まれます。
このシリーズでは、前述の各トピックに対するガイダンスとヒントを示します。 大規模なエンタープライズ構成で DSVM を展開する際の考慮事項と要件がすべて含まれているわけではありません。 企業で DSVM インスタンスを実装するときに使用できる、いくつかのその他の Azure リソースを次に示します。
最後に、Azure アーキテクチャ センターでは、クラウド ベースの分析インフラストラクチャを構築して管理するための詳細なエンドツーエンド アーキテクチャとモデルが提供されています。