AI モデルおよび ML モデルをトレーニングする

[アーティクル]
11/19/2024

このセクションでは、Mosaic AI で機械学習モデルおよび AI モデルをトレーニングする方法について説明します。

モザイク AI モデルトレーニングは、AutoML と Foundation Model の微調整ワークロードを通じて、従来の ML モデルのトレーニングとデプロイのプロセスを合理化し、統合します。

AutoML

AutoML は、最適なアルゴリズムとハイパーパラメーター構成を自動的に見つけることで、データセットに機械学習を適用するプロセスを簡略化します。 AutoML には、コードなしの UI と Python API が用意されています。

基盤モデルの微調整

Databricks の基盤モデルの微調整 (現在はモザイク AI モデルトレーニングの一部) では、独自のデータを使用して大規模な言語モデル (LLM) をカスタマイズできます。このプロセスでは、既存の基盤モデルのトレーニングを微調整することで、モデルをゼロからトレーニングする場合と比較して、必要なデータ、時間、コンピューティングリソースを大幅に削減します。主な特徴は次のとおりです。

監視付き微調整: 構造化されたプロンプト応答データでトレーニングすることで、モデルを新しいタスクに適応させます。
継続的な事前トレーニング: 追加のテキストデータを使用してモデルを強化し、新しい知識を追加したり、特定のドメインに焦点を当てたりします。
チャット補完: チャットログでモデルをトレーニングし、会話能力を向上させます。

オープンソースライブラリの例

Optuna と Hyperopt を使用したハイパーパラメーター調整の例など、さまざまなオープンソース機械学習ライブラリから機械学習トレーニングの例を参照してください。

ディープラーニング

Azure Databricks でディープラーニングモデルを開発して微調整できるよう、分散ディープラーニングトレーニングの例とベストプラクティスを参照してください。

レコメンダー

Azure Databricks でディープラーニングベースのレコメンデーションモデルをトレーニングする方法について説明します。ディープラーニングモデルでは、従来のレコメンデーションモデルよりも質の高い結果を得られるほか、スケーリングによってより多くのデータに対応できます。

次の方法で共有

AI モデルおよび ML モデルをトレーニングする

AutoML

基盤モデルの微調整

オープンソースライブラリの例

ディープラーニング

レコメンダー

フィードバック

その他のリソース

次の方法で共有

AI モデルおよび ML モデルをトレーニングする

AutoML

基盤モデルの微調整

オープン ソース ライブラリの例

ディープ ラーニング

レコメンダー

フィードバック

その他のリソース

オープンソースライブラリの例

ディープラーニング