Lista de verificação de revisão de design para Excelência Operacional
Esta lista de verificação apresenta um conjunto de recomendações para o ajudar a criar uma cultura de excelência operacional. Comece com uma abordagem de DevOps para integrar especializações de várias disciplinas. Esta abordagem cria uma prática rigorosa de conceção e desenvolvimento. Esta abordagem leva a implementações repetíveis, fiáveis e seguras de infraestrutura e código.
Priorize a intervenção humana em áreas que dela beneficiam e incorpore a automatização noutras áreas. A observabilidade serve a excelência operacional ao monitorizar eventos de estado de funcionamento e também para validar a conceção e implementação da carga de trabalho atual para informar o desenvolvimento futuro do produto.
Se não considerar as vantagens e recomendações de excelência operacional, a carga de trabalho poderá estar em risco. Considere cuidadosamente os pontos abrangidos na seguinte lista de verificação para incutir confiança no sucesso da sua estrutura.
Lista de Verificação
Código | Recomendação | |
---|---|---|
☐ | OE:01 | Determine as especializações dos membros da equipa de carga de trabalho e integre-as num conjunto robusto de práticas para conceber, desenvolver, implementar e operar a carga de trabalho de acordo com a especificação. Os membros da equipa têm de ter clareza na tomada de decisões e responsabilidades, valorizar a melhoria e otimização contínuas e adotar uma cultura sem culpa que incorpore a aprendizagem contínua. |
☐ | OE:02 | Formalize a forma como executa tarefas operacionais de rotina, conforme necessário, e de emergência através da documentação, listas de verificação ou automatização. Procure consistência e previsibilidade para processos de equipa e materiais a entregar através da adoção de práticas e abordagens líderes do setor, como uma abordagem de mudança para a esquerda . |
☐ | OE:03 | Formalizar processos de planeamento e ideação de software. Desenhe a partir de normas de indústria e organizacionais estabelecidas. Utilize um registo de tarefas pendentes com prioridades comuns e especificações suficientemente detalhadas. Com base nos resultados, impulsione melhorias contínuas no seu processo de planeamento. |
☐ |
OE:04 OE:04 OE:04 |
Otimize o desenvolvimento de software e os processos de garantia de qualidade ao seguir as práticas comprovadas pela indústria para desenvolvimento e teste. Para designação de função inequívoca, uniformize práticas entre componentes como ferramentas, controlo de origem, padrões de conceção de aplicações, documentação e guias de estilo. |
☐ | OE:05 | Prepare os recursos e as respetivas configurações com uma abordagem de infraestrutura padronizada como código (IaC). Tal como outros códigos, crie IaC com estilos consistentes, modularização adequada e garantia de qualidade. Preferir uma abordagem declarativa sempre que possível. |
☐ | OE:06 | Crie uma cadeia de fornecimento de cargas de trabalho que impulsione as alterações propostas através de pipelines automatizados previsíveis. Os pipelines testam e promovem essas alterações em ambientes. Otimize uma cadeia de fornecimento para tornar a carga de trabalho fiável, segura, económica e eficaz. |
☐ |
OE:07 OE:07 |
Crie e implemente um sistema de monitorização para validar escolhas de design e informar futuras decisões empresariais e de design. Este sistema captura e expõe telemetria operacional, métricas e registos que emitem a partir da infraestrutura e código da carga de trabalho. |
☐ | OE:08 | Desenvolver uma prática eficaz de operações de emergência. Certifique-se de que a carga de trabalho emite sinais de estado de funcionamento significativos em toda a infraestrutura e código. Recolha os dados resultantes e utilize-os para gerar alertas acionáveis que decretam respostas de emergência através de dashboards e consultas. Defina claramente as responsabilidades humanas, tais como rotações de chamada, gestão de incidentes, acesso a recursos de emergência e execução de autópsias. |
☐ | OE:09 | Automatizar todas as tarefas que não beneficiam da perspicácia e da adaptabilidade da intervenção humana, são altamente processuais e têm um prazo de validade que gera um retorno sobre o investimento em automatização. Sempre que possível, selecione software off-the-shelf para automatização versus implementações personalizadas. Trate toda a automatização da mesma forma que os componentes da carga de trabalho e aplique os pilares do Well-Architected Framework à sua conceção e implementação. |
☐ | OE:10 | Crie e implemente a automatização antecipadamente para operações como problemas de ciclo de vida, bootstrapping e aplicação de proteções de governação e conformidade. Não tente reajustar a automatização mais tarde. Selecione as funcionalidades de automatização fornecidas pela sua plataforma. |
☐ | OE:11 | Defina claramente as práticas de implementação seguras da carga de trabalho. Realce os ideais de métodos de lançamento pequenos, incrementais e com porta de qualidade. Utilize padrões de implementação modernos e técnicas de exposição progressiva para controlar o risco. Conta para implementações de rotina e implementações de emergência ou correções. |
☐ | OE:12 | Implemente uma estratégia de mitigação de falhas de implementação que resolve problemas inesperados de implementação intermédia com a recuperação rápida. Combine várias abordagens, como reversão, desativação de funcionalidades ou utilização das capacidades nativas do padrão de implementação. |
Passos seguintes
Recomendamos que reveja as desvantagens de Excelência Operacional para explorar outros conceitos.