Cargas de trabalho de IA no Azure
Este artigo aborda os desafios arquitetônicos de criação de cargas de trabalho de IA. Ele se concentra em funcionalidades não determinísticas, design de dados e aplicativos e operações. As recomendações são baseadas nos princípios do Azure Well-Architected Framework e incluem insights de implementações bem-sucedidas do Azure.
Esses artigos destinam-se a proprietários de carga de trabalho e partes interessadas técnicas, como arquitetos, líderes de desenvolvimento e líderes de TI. Funções especializadas em IA e dados, como cientistas de dados, também devem estar cientes dessa orientação, pois a colaboração entre várias funções e equipes é um aspecto fundamental.
Observação
O Azure oferece vários serviços de IA que você pode integrar à carga de trabalho ou criar em torno dele. Dependendo das suas necessidades de negócios, você pode escolher entre soluções saaS (software como serviço) totalmente gerenciadas, soluções paaS (plataforma como serviço) ou criar sua própria solução de IA. Serviços específicos do Azure e seus recursos não são abordados aqui. Recomendamos que você consulte a respectiva documentação do produto para essas informações.
Além disso, determinadas cargas de trabalho de IA não estão no escopo, como:
- Cargas de trabalho que são realizadas por meio de ofertas de código baixo e sem código, como o Copilot Studio.
- Cargas de trabalho que exigem computação de alto desempenho.
- Cargas de trabalho que não implementam casos de uso de IA generativa ou discriminativa.
O que é uma carga de trabalho de IA?
No contexto do Well-Architected Framework, uma carga de trabalho de IA atende às necessidades de tarefas preditivas, discriminatórias ou generativas. Ele se concentra na funcionalidade ética, adaptando-se às tecnologias de IA em rápida evolução e mantendo-se relevante e explicável. Aplique os pilares do Well-Architected Framework a cada ponto de decisão para garantir que o sistema seja confiável, seguro, eficiente e econômico.
As cargas de trabalho de IA são diferentes das tradicionais porque substituem a funcionalidade determinística em partes da carga de trabalho por um comportamento não determinístico que resolve situações em que os resultados fixos são impraticáveis. Em vez disso, eles combinam código e dados em uma entidade ou um modelo , para habilitar experiências exclusivas que os sistemas tradicionais não podem fornecer.
Antes de iniciar suas estratégias de design, considere esses pontos-chave primeiro.
Familiarize-se com as amplas categorias de modelos
IA Generativa: usa o aprendizado de máquina para criar novo conteúdo de forma autônoma. Ele inclui modelos de linguagem que podem ser personalizados com dados do usuário ou usados como serviços como o Serviço OpenAI do Azure. Por exemplo, GPT, um tipo de modelo de linguagem, é especializado em imitar a linguagem conversacional humana e é ideal para experiências de bate-papo e linguagem natural.
Casos de uso: a IA generativa pode produzir artigos, histórias e arte. Ele também pode gerar dados sintéticos para equilibrar conjuntos de dados e tornar os chatbots mais humanos.
IA Discriminativa: usa programação explícita para executar tarefas específicas com base em regras e algoritmos. Ele é dividido em:
- baseado em modelo: os sistemas preditivos encontram padrões com base no treinamento realizado a partir de observações anteriores para fazer previsões, mas não podem criar um novo conteúdo ou se adaptar por conta própria.
- não baseado em modelo: agentes autônomos seguem regras predefinidas para interagir com sistemas, como caracteres de videogame.
Caso de uso: a IA discriminativa é usada para análise preditiva, sistemas de recomendação e detecção de fraudes.
Esta série de artigos aborda diferentes cargas de trabalho de IA e se concentra em tipos específicos, como modelos de linguagem, quando necessário.
Importante
Ao escolher entre modelos generativos e discriminativos, pense na tarefa que você precisa realizar. Modelos generativos criam novos dados. Modelos discriminativos classificam os dados existentes com base nas características. Para tarefas de classificação ou regressão, escolha modelos que se ajustem ao trabalho. Por exemplo, um modelo de linguagem que pode classificar pode ser mais versátil do que um que apenas classifica.
Avalie suas opções de construção versus compra
Se as respostas genéricas forem aceitáveis, um modelo predefinido ou uma solução baseada em serviço de IA que usa processamento opaco deve ser suficiente para sua carga de trabalho. Mas se você precisar de dados específicos para sua empresa ou tiver requisitos de conformidade, crie um modelo personalizado.
Ao escolher entre um modelo personalizado, um modelo predefinido ou um serviço, considere estes fatores:
- Controle de dados: modelos personalizados oferecem mais controle sobre dados confidenciais. Modelos pré-criados são mais fáceis para tarefas gerais.
- Personalização: Modelos personalizados são melhores para necessidades exclusivas. Modelos predefinidos podem não ter flexibilidade.
- custo e manutenção: modelos personalizados precisam de manutenção e recursos contínuos. Os modelos pré-construídos geralmente têm custos iniciais mais baixos e menos carga de infraestrutura.
- Desempenho: Serviços predefinidos oferecem infraestrutura e escalabilidade otimizadas. Eles são ideais para necessidades de baixa latência ou alta escalabilidade.
- Expertise: modelos personalizados exigem uma equipe qualificada. Os modelos predefinidos geralmente são mais rápidos de implantar e mais fáceis de usar se a experiência for limitada.
Importante
Criar e manter seu próprio modelo requer muitos recursos, tempo e experiência. É importante pesquisar minuciosamente antes de decidir. Normalmente, escolher um modelo pré-criado ou um serviço gerenciado é uma opção melhor.
Quais são os desafios comuns?
- custos de computação: as funções de IA podem ser caras devido às altas necessidades de computação e as necessidades de computação podem variar de acordo com o design da carga de trabalho. Entenda suas necessidades e escolha o serviço certo para gerenciar custos.
- requisitos de segurança e conformidade: soluções fora da prateleira podem não atender às suas necessidades de segurança e conformidade. Pesquise opções para evitar encargos desnecessários.
- Volume de dados: lidar com grandes volumes de dados em vários formatos vem com desafios de proteger informações confidenciais e processamento eficiente. Otimizar os custos de armazenamento, processamento e transferência deve ser uma atividade contínua.
- Decadência do modelo: os modelos podem degradar ao longo do tempo, o que leva a resultados imprecisos. Testar sistemas de IA é desafiador devido à sua aleatoriedade.
- desafios de habilidade: novas cargas de trabalho de IA podem precisar de funções especializadas e novos processos de operações que exigem treinamento extensivo.
- Pace of AI innovation: Adotar as tecnologias mais recentes pode ser tentador para se manter na vanguarda. Avalie as novas tecnologias com cuidado para garantir que elas melhorem a experiência do usuário e não apenas adicionem complexidade por estarem atualizadas.
- requisitos éticos: determine claramente se seu caso de uso é um destino ético para IA. Manter os padrões éticos é necessário durante as fases de planejamento e implementação para garantir que você esteja construindo um sistema responsável.
Como usar essas diretrizes
✔ Iniciar com Metodologia de Design, que descreve os temas racionales e recorrentes em áreas técnicas e operacionais. Essa abordagem sistemática ajuda a definir requisitos e estratégias de design. Revisite essa metodologia quando você enfrentar escolhas incertas para se manter alinhado com as metas gerais da carga de trabalho. Ele também fornece uma estrutura para colaborar com as partes interessadas para justificar decisões técnicas e incorporar o feedback do cliente para melhoria contínua.
✔ Prossiga para Princípios de Design para ver como a metodologia de design se alinha com os principais pilares da estrutura de Well-Architected. Considere a evolução do crescimento. Avalie os princípios subjacentes para todos os pilares coletivamente, incluindo as compensações.
✔ Concentre-se nas áreas de design que têm o maior efeito em sua solução. Cada área inclui considerações e recomendações para guiá-lo pelas decisões de design.
✔ Use a Ferramenta de Revisão de Avaliação para avaliar a prontidão da sua carga de trabalho de IA otimizada em produção.
Padrão de arquitetura típico e áreas de design
O diagrama a seguir ilustra como os dados fluem pelo sistema desde a coleta inicial até a interação final do usuário.
A arquitetura destaca a integração de diferentes componentes para permitir processamento eficiente de dados, otimização de modelos e implantação de aplicativos em tempo real em soluções orientadas por IA. Ele inclui módulos como fontes de dados, processamento de dados, treinamento de modelo, implantação de modelo e interfaces do usuário.
A tabela a seguir descreve algumas das principais áreas de design relacionadas a esse padrão.
Áreas de design |
---|
design de aplicativo: saiba mais sobre considerações exclusivas para cargas de trabalho de IA que podem ter um efeito significativo nos padrões de design de aplicativo existentes. |
plataforma de aplicativo: determine as melhores plataformas a serem usadas para dar suporte a funções de carga de trabalho de IA, como hospedagem de modelo, treinamento de modelo e inferência. |
Design de dados de treinamento: Elabore estratégias de ingestão de dados, pré-processamento, retenção e governança para gerenciar os dados de treinamento do modelo. |
Design de dados fundamentais: Estruture estratégias para otimizar a capacidade de pesquisa e recuperação, enquanto atende aos requisitos de segurança e normativos para seus dados fundamentais. |
Plataforma de dados: determine a melhor plataforma de hospedagem para lidar com grandes quantidades e, potencialmente, muitos formatos de dados que sua carga de trabalho usa. |
operações de machine learning e operações de IA generativas: estabeleça práticas modernas de DevOps para dar suporte a seus sistemas e funções de IA geradoras ou de aprendizado de máquina. |
Operações de carga de trabalho: Modernize suas práticas operacionais com novas abordagens e adicione funções especializadas e treinamento. |
Teste e avaliação: desenvolva estratégias de teste e avaliação para medir características como acurácia, precisão, sensibilidade e especificidade usando métricas específicas para cargas de trabalho de IA. |
Personas de Carga de Trabalho: Entenda como as personas estão envolvidas no ciclo de vida completo de sua carga de trabalho de IA para ajudar a garantir que sua equipe seja totalmente capaz de desenvolvê-la e suportá-la. |
de IA responsável: preste atenção especial à experiência do usuário e às implicações éticas de liberar sua solução de IA ao público. A IA traz oportunidades incríveis para novos produtos e serviços, mas também traz um grau considerável de risco. |
Dica
Cada decisão arquitetônica envolve uma série de considerações e um conjunto de compromissos reconhecidos que equilibram diferentes aspectos da estrutura. Essas compensações são indicadas por este ícone .