Esempi di training del modello
Questa sezione include esempi che illustrano come eseguire il training di modelli di Machine Learning in Azure Databricks usando molte librerie open source più diffuse.
È anche possibile usare AutoML, che prepara automaticamente un set di dati per il training del modello, esegue un set di versioni di valutazione usando librerie open source come scikit-learn e XGBoost e crea un notebook Python con il codice sorgente per ogni esecuzione di valutazione in modo da poter esaminare, riprodurre e modificare il codice.
Esempi di Machine Learning
Pacchetto | Notebook | Funzionalità |
---|---|---|
scikit-learn | Esercitazione su Machine Learning | Unity Catalog, modello di classificazione, MLflow, ottimizzazione automatizzata degli iperparametri con Hyperopt e MLflow |
scikit-learn | Esempio end-to-end | Unity Catalog, modello di classificazione, MLflow, ottimizzazione automatizzata degli iperparametri con Hyperopt e MLflow, XGBoost |
MLlib | Esempi di MLlib | Classificazione binaria, alberi delle decisioni, regressione GBT, Structured Streaming, trasformatore personalizzato |
xgboost | Esempi di XGBoost | Python, PySpark e Scala, carichi di lavoro a nodo singolo e training distribuito |
Esempi di ottimizzazione degli iperparametri
Per informazioni generali sull'ottimizzazione degli iperparametri in Azure Databricks, vedere Ottimizzazione degli iperparametri.
Pacchetto | Notebook | Funzionalità |
---|---|---|
Optuna | Introduzione a Optuna | Optuna, distributed Optuna, scikit-learn, MLflow |
Hyperopt | Hyperopt distribuito | Hyperopt distribuito, scikit-learn, MLflow |
Hyperopt | Confrontare i modelli | Usare l'hyperopt distribuito per cercare contemporaneamente spazio degli iperparametri per tipi di modello diversi |
Hyperopt | Algoritmi di training distribuiti e hyperopt | Hyperopt, MLlib |
Hyperopt | Procedure consigliate per Hyperopt | Procedure consigliate per set di dati di dimensioni diverse |