Entender o problema de negócios
Imagine que você é um engenheiro de aprendizado de máquina na Proseware, uma jovem start-up, trabalhando em um novo aplicativo para o setor da saúde. O modelo de classificação de diabetes, criado pelos cientistas de dados, é o primeiro modelo a ser integrado ao aplicativo. Depois de conversar com a equipe maior, acontece que a meta é ter vários modelos integrados ao aplicativo Web.
Quando o modelo de classificação de diabetes se mostra bem-sucedido, a Proseware quer adicionar mais modelos de machine learning, para que os profissionais da saúde possam diagnosticar pacientes com mais rapidez para várias doenças. Para cada novo modelo, a equipe de ciência de dados precisará ser capaz de experimentar em um ambiente seguro. Depois que o novo modelo for preciso o suficiente para ser integrado ao aplicativo Web, ele deverá ser testado antes de implantá-lo em um ponto de extremidade que será chamado do aplicativo Web.
Junto com a equipe, você decide que é melhor usar ambientes diferentes:
- Desenvolvimento para experimentação.
- Preparo para o teste.
- Produção para implantar o modelo no ponto de extremidade de produção.
Para cada ambiente, você criará um workspace separado do Azure Machine Learning. Mantendo os workspaces separados para cada ambiente, você poderá proteger dados e recursos. Por exemplo, o workspace de desenvolvimento não conterá dados pessoais de pacientes. E os cientistas de dados só terão acesso ao workspace de desenvolvimento, pois só precisam de um ambiente para experimentação e não precisam de acesso a nenhum dos recursos ou código de produção.
Como engenheiro de aprendizado de máquina, você precisa garantir que tudo o que os cientistas de dados criarem será movido com facilidade entre ambientes. Depois que um novo modelo estiver pronto para ser implantado, você deseja que o modelo seja treinado e testado no ambiente de preparo. Depois de testar o código, o modelo e a implantação, você deseja implantar o modelo no ambiente de produção. Partes desse processo podem ser automatizadas para acelerar o processo.
Para trabalhar com ambientes, você deverá:
- Criar ambientes no seu repositório do GitHub.
- Armazenar credenciais para cada workspace do Azure Machine Learning como um segredo de ambiente no GitHub.
- Adicione revisores necessários a ambientes para aprovação restrita.
- Use ambientes em seus fluxos de trabalho do GitHub Actions.