Tutorial: modelos de ML de ponta a ponta no Azure Databricks
O aprendizado de máquina no mundo real é confuso. As fontes de dados contêm valores ignorados, incluem linhas redundantes ou podem não caber na memória. A engenharia de recursos frequentemente exige alguma experiência na área e pode ser entediante. A modelagem geralmente combina a ciência de dados e a engenharia de sistemas, exigindo não apenas o conhecimento dos algoritmos, mas também da arquitetura da computador e dos sistemas distribuídos.
O Azure Databricks simplifica esse processo. O notebook de tutorial de 10 minutos a seguir mostra um exemplo de ponta a ponta de treinamento de modelos de aprendizado de máquina em dados tabulares.
Você pode importar este notebook e executá-lo por conta própria ou copiar snippets de código e ideias para usar.
Notebook
Se o seu espaço de trabalho estiver habilitado para o Unity Catalog, use esta versão do notebook:
Use o scikit-learn com integração do MLflow no Databricks (Catálogo do Unity)
Se o seu espaço de trabalho não estiver habilitado para o Catálogo do Unity, use esta versão do notebook: