Erreurs et actions dans Azure Chaos Studio
Dans Azure Chaos Studio, chaque activité qui se produit dans le cadre d’une expérience est appelée une action. Le type d’action le plus courant est une erreur. Cet article décrit les actions et les erreurs ainsi que les propriétés correspondantes.
Actions d’expérimentation
Une action est une activité orchestrée dans le cadre d’une expérience de chaos. Les actions sont organisées en étapes et en branches, ce qui permet de les exécuter de façon séquentielle ou en parallèle. À chaque action sont associées les propriétés suivantes :
- Nom : action spécifique exécutée. Un nom prend généralement la forme de l’URN d’une action, par exemple
urn
. - Type : la manière dont l’action s’exécute. Les actions peuvent être continues ou discrètes. Une action continue s’exécute sans interruption sur une période donnée. Par exemple, l’application d’une pression CPU pendant 10 minutes. Une action discrète ne se produit qu’une seule fois. Par exemple, le redémarrage d’une instance Azure Cache pour Redis.
Types d’actions
Il existe deux sortes d’actions dans Chaos Studio :
- Erreurs : cette action entraîne une perturbation d’une ou plusieurs ressources.
- Temporisations : cette action applique un délai d’attente sans affecter les ressources. Elle est utile pour faire une pause entre les erreurs afin d’attendre qu’un système soit affecté par l’erreur précédente.
Pannes
Les erreurs représentent l’action la plus courante dans Chaos Studio. Les erreurs provoquent une perturbation dans un système, ce qui vous permet de vérifier que le système la gère efficacement sans affecter la disponibilité.
Les erreurs peuvent :
- Être destructrices. Par exemple, une erreur peut tuer un processus.
- Appliquer une pression. Par exemple, une erreur peut ajouter une pression sur la mémoire virtuelle.
- Ajouter une latence.
- Entraîner une modification de configuration.
En plus d’un nom et d’un type, les erreurs peuvent également avoir une durée, si elles sont continues, et des paramètres. Les paramètres décrivent comment l’erreur doit être appliquée et sont spécifiques au nom de l’erreur. Par exemple, la région de lecture qui sera promue en région d’écriture durant la panne de la région d’écriture est un paramètre pour l’erreur de basculement de Azure Cosmos DB. Certains paramètres sont requis, tandis que d’autres sont facultatifs.
Les erreurs sont basées sur des agents ou de type service-direct selon le type de cible. Une erreur basée sur un agent nécessite l’installation de l’agent Chaos Studio sur une machine virtuelle ou un groupe de machines virtuelles identiques. L’agent est disponible pour Windows et Linux, mais toutes les erreurs ne sont pas disponibles sur les deux systèmes d’exploitation. Pour plus d’informations sur les erreurs prises en charge sur chaque système d’exploitation, consultez la bibliothèque d’erreurs et d’actions de Chaos Studio. Les erreurs directes de service ne nécessitent aucun agent. Elles s’exécutent directement sur une ressource Azure.
Les erreurs incluent également le nom du sélecteur qui décrit les ressources sur lesquelles l’erreur s’exécute. Pour en savoir plus sur les sélecteurs, consultez les Expériences Chaos. Une erreur peut affecter une ressource uniquement si la ressource a été intégrée en tant que cible et que la fonctionnalité d’erreur correspondante est activée sur la ressource.
Étapes suivantes
Maintenant que vous comprenez ce que sont les actions et les erreurs, vous êtes prêt à :