Treinar modelos de IA e ML

Artigo
10/15/2024

Esta seção mostra como treinar modelos de aprendizado de máquina e de IA na IA do Mosaic.

AutoML

O AutoML do Databricks simplifica o processo de aplicação de aprendizado de máquina aos seus conjuntos de dados ao encontrar automaticamente a melhor configuração de algoritmo e hiperparâmetro para você. O AutoML oferece uma interface de usuário low-code, além de uma API do Python.

Treinamento do modelo de IA do Mosaico

O treinamento de modelo de IA Mosaic (anteriormente treinamento de modelos de fundação) no Databricks permite personalizar LLMs (modelos de linguagem grandes) usando seus próprios dados. Esse processo envolve o ajuste refinado do treinamento de um modelo de fundação pré-existente, o que reduz significativamente os dados, o tempo e os recursos de computação necessários em comparação ao treinamento de um modelo do zero. Os principais recursos incluem:

Ajuste refinado supervisionado: adapte o modelo a novas tarefas realizando o treinamento com base em dados estruturados de resposta imediata.
Pré-treinamento contínuo: aprimore o modelo com dados de texto adicionais para adicionar conhecimentos ou focar em um domínio específico.
Preenchimento de chat: treine o modelo em logs de chat para melhorar as habilidades de conversação.

Exemplos de bibliotecas de software livre

Confira exemplos de treinamento de aprendizado de máquina em uma ampla variedade de bibliotecas de aprendizado de máquina de software livre, incluindo exemplos de ajuste de hiperparâmetros usando Optuna e Hyperopt.

Aprendizado

Confira exemplos e melhores práticas para treinamento de aprendizado profundo distribuído para que você possa desenvolver e ajustar modelos de aprendizado profundo no Azure Databricks.

Recomendações

Saiba como treinar modelos de recomendação baseados em aprendizado profundo no Azure Databricks. Em comparação com os modelos de recomendação tradicionais, os modelos de aprendizado profundo podem obter resultados de maior qualidade e ser dimensionados para grandes quantidades de dados.

Compartilhar via