チュートリアル: Azure Databricks でのエンド ツー エンド ML モデル
現実の世界での機械学習は煩雑です。 データ ソースに不足値が含まれていたり、冗長な行が含まれていたり、メモリに収まらない可能性もあります。 特徴エンジニアリングには多くの場合、ドメインの専門知識が求められますが、単調な作業になる可能性があります。 モデリングではデータ サイエンスとシステム エンジニアリングが混在する場合が多々生じるため、アルゴリズムだけでなく、マシン アーキテクチャと分散システムに関する知識も必要になります。
Azure Databricks はこのプロセスを簡略化します。 次の 10 分間のチュートリアル ノートブックでは、表形式データに対する機械学習モデルのトレーニングのエンドツーエンドの例が示されています。
このノートブックをインポートして自分で実行することも、独自で使用するためにコード スニペットをコピーし、そのアイデアを活かすこともできます。
ノートブック
ワークスペースで Unity Catalog が有効になっている場合は、次のバージョンのノートブックを使用します。
Databricks で scikit-learn と MLflow の統合を使用する (Unity Catalog)
ワークスペースが Unity Catalog に対して有効になっていない場合は、次のバージョンのノートブックを使用します。