Partager via


Utilisation d'événements à l'aide d'Application Diagnostics

 

S'applique à: System Center 2012 R2 Operations Manager, System Center 2012 - Operations Manager, System Center 2012 SP1 - Operations Manager

L'utilisation des alertes fait partie intégrante de l'utilisation de System Center 2012 – Operations Manager. Les alertes d'analyse des applications .NET vous indiquent les informations que vous reconnaissez d'autres alertes, telles que les informations générales et la Base de connaissances du produit. Cependant, une alerte d'application .NET fournit également un lien dans la description de l'alerte. Ce lien ouvre l'événement qui a déclenché l'alerte dans Application Diagnostics. Vous trouverez ici de nombreuses informations supplémentaires qui vous aideront à identifier et résoudre votre problème.

Notes

Une résolution en profondeur des problèmes d'alertes en provenance de l'analyse des performances des applications requiert souvent l'accès au code source des applications et peut nécessiter l'intervention de développeurs. Vous pouvez installer le pack d'administration de synchronisation des éléments de travail de Team Foundation Server et transmettre des alertes au Team Foundation Server utilisé par l'équipe de développement. Le pack d'administration de synchronisation des éléments de travail de Team Foundation Server effectue le suivi et la synchronisation des modifications apportées aux éléments de travail de Team Foundation Server, ainsi que des modifications apportées aux alertes Operations Manager associées.

Examen des alertes d'application .NET

La réduction du temps nécessaire pour déterminer, attribuer et résoudre les problèmes est l'objectif principal de l'analyse des applications dans Operations Manager. Lorsque vous recevez une alerte, vous devez en connaître la cause (le système hébergeant l'application ou le code), être en mesure de fournir les données qui corroborent cette conclusion et voir clairement qui doit corriger le problème. Pour savoir s'il s'agit d'un problème système, vous devez connaître l'état de votre système au moment de l'événement. Pour savoir où le problème racine s'est produit, vous devez connaître la chaîne d'appels qui s'est produite. Pour approfondir vos recherches, vous devez comparer les événements similaires et connexes qui se sont produits simultanément. Les détails de l'événement, les compteurs de performances et les chaînes distribuées vous permettront de déterminer à qui doit être adressé ce problème en premier. S'il s'agit d'une erreur système, vous pouvez ajuster les ressources disponibles ou la configuration du système hôte et résoudre le problème au niveau de l'hôte. S'il s'agit d'une défaillance de l'application, le problème doit être adressé à l'équipe de l'application, ainsi que la ligne de code où la défaillance s'est produite. Voici certaines stratégies pour utiliser les affichages, filtres et paramètres d'Application Diagnostics qui vous aideront à identifier l'origine du problème, à trouver une solution et à mieux savoir qui est concerné par la résolution du problème.

Pour ouvrir Application Diagnostics à partir d'une alerte

  1. Dans la mesure où vous répondez aux alertes liées à des groupes d'applications spécifiques que vous avez configurés, il est utile d'étendre les alertes actives et de les afficher par groupe d'applications. Dans la console Operations Manager, dans le volet de navigation, cliquez sur le bouton Analyse, développez Application Monitoring, développez .NET Monitoring, cliquez sur le dossier portant le nom du groupe d'applications que vous avez configuré pour l'analyse des alertes que vous souhaitez examiner, puis cliquez sur Alertes actives.

  2. Double-cliquez sur l'alerte que vous souhaitez ouvrir.

  3. Dans la page Propriétés de l'alerte, cliquez sur le lien du volet Description de l'alerte. Cette action ouvre Application Diagnostics, une nouvelle fonctionnalité d'analyse d'Operations Manager, dans un navigateur Web. Dans l'onglet Propriétés de l'événement, vous découvrez des informations sur l'alerte, telles que les mesures de performances, la pile des appels et les remarques sur la collection. Dans les onglets, vous pouvez voir les événements similaires et connexes, les chaînes d'événements et les compteurs de performances. Il s'agit d'informations détaillées sur l'événement d'exception ou de performances déclenché pour l'application qui vous aidera à identifier si le problème vient de l'application elle-même, d'un appel à un service Web ou d'un appel à une base de données. Pour plus d'informations sur l'onglet Propriétés de l'événement, consultez Détails de l'événement de performances. Cliquez sur Oui pour fermer la fenêtre principale à la fin du chargement des informations d'événement.

    Notes

    Ce lien vers Application Diagnostics se trouve également dans l'onglet Contexte de l'alerte.

Utilisez les procédures suivantes pour examiner votre alerte. Les professionnels de l'informatique souhaiteront probablement utiliser les informations des onglets Propriétés de l'événement, Compteurs de performance et Chaînes distribuées pour découvrir ce qui est arrivé, comprendre si un problème système a déclenché l'alerte et déterminer l'origine du problème. Les développeurs souhaiteront probablement utiliser les informations des onglets Chaînes distribuées, Événements similaires et Événements connexes pour comprendre le contexte spécifique dans lequel s'est produit un problème de code.

Pour résoudre les problèmes à l'aide des propriétés des événements d'exception dans Application Diagnostics

  1. Dans la fenêtre Application Diagnostics de l'alerte d'exception que vous examinez, cliquez dans l'onglet Propriétés de l'événement pour afficher des détails importants sur l'alerte. Cet onglet est à consulter en priorité pour vérifier si le problème d'alerte est visible. La page Propriétés de l'événement comprend notamment les principales catégories d'informations suivantes :

    - **Source** Pour afficher les temps de chargement et de réponse des applications, cliquez sur le lien **Source** dans le coin supérieur gauche. Ces informations présentent la charge à laquelle le système était soumis lors de la défaillance de l'événement d'exception. Pour afficher les compteurs de performances et évaluer plus en détail l'état du système, dans la page Source, cliquez dans l'onglet **Rapports de tendance**. Pour découvrir les ordinateurs sur lesquels fonctionne cette application et vérifier l'absence de tout problème d'équilibrage de charge sur les ordinateurs, cliquez dans l'onglet **Ordinateurs**. Pour voir le détail des appels connexes, ou dans le cas où les événements se produisent en fonction de chaînes, cliquez dans l'onglet **Topologie**.
    
    - **Chaîne d'exception** Cette catégorie s'affiche pour les événements d'exception. Développez Chaîne d'exception pour afficher l'exception réelle qui s'est produite.
    
    - **Données d'exception** Cette catégorie s'affiche pour les événements d'exception et présente les paramètres et variables définis pour la classe par le biais de l'exception.
    
    - **Pile** Il s'agit de la pile des appels ou de l'ordre dans lequel les événements se sont produits. L'arborescence d'exécution vous permet de développer les nœuds pour examiner les appels. Cliquez sur la case d'option **Affichage du groupe de ressources** pour afficher une vue d'ensemble du temps de chaque appel. Cela permet de situer le niveau du problème ou son emplacement.
    
    - **Liste des modules** Cette catégorie s'affiche pour les événements d'exception et présente les modules chargés au moment de l'exception.
    
    - **Remarques sur la collection** Cette catégorie affiche toutes les remarques relatives à l'événement.
    
    System_CAPS_tipConseil

    Utilisez les mêmes étapes de résolution des problèmes pour les événements de performances, les événements similaires, les événements connexes, les chaînes distribuées et les compteurs de performances que pour les événements d'exception.

Pour résoudre les problèmes à l'aide des propriétés des événements de performances dans Application Diagnostics

  1. Dans la fenêtre Application Diagnostics de l'alerte de performances que vous examinez, cliquez dans l'onglet Propriétés de l'événement pour afficher des détails importants sur l'alerte. Cet onglet est à consulter en priorité pour vérifier si le problème d'alerte est visible. La page Propriétés de performance comprend notamment les principales catégories d'informations suivantes :

    - **Source** Pour afficher les temps de chargement et de réponse des applications, cliquez sur le lien **Source** dans le coin supérieur gauche. Ces informations présentent la charge à laquelle le système était soumis lors de la défaillance de l'événement d'exception. Pour afficher les compteurs de performances et évaluer plus en détail l'état du système, dans la page Source, cliquez dans l'onglet **Rapports de tendance**. Pour découvrir les ordinateurs sur lesquels fonctionne cette application et vérifier l'absence de tout problème d'équilibrage de charge sur les ordinateurs, cliquez dans l'onglet **Ordinateurs**. Pour voir le détail des appels connexes, ou dans le cas où les événements se produisent en fonction de chaînes, cliquez dans l'onglet **Topologie**.
    
    - **Nœuds les plus lents** Cette catégorie répertorie les nœuds les plus lents dans l'arborescence d'exécution et la cause la plus probable des problèmes de performances dans l'application.
    
    - **Pile** Il s'agit de la pile des appels ou de l'ordre dans lequel les événements se sont produits. L'arborescence d'exécution vous permet de développer les nœuds pour examiner les appels. Cliquez sur la case d'option **Affichage du groupe de ressources** pour afficher une vue d'ensemble du temps de chaque appel. Cela permet de situer le niveau du problème et son emplacement.
    
    - **Remarques sur la collection** Cette catégorie affiche toutes les remarques relatives à l'événement.
    

Pour résoudre les problèmes liés à l'état du système à l'aide du compteur de performances

  1. Pour afficher une table ou un diagramme des compteurs de performances clés, cliquez dans l'onglet Compteurs de performance.

    Notes

    Quinze minutes de données de performances sont collectées et mises en cache sur le système analysé. Lorsqu'une performance ou une exception est déclenchée, les données de performances sont renvoyées à Operations Manager avec l'événement.

  2. Cochez les cases des compteurs de performances que vous souhaitez inclure dans vos informations, puis cliquez sur Appliquer.

  3. Utilisez les informations de cet affichage pour évaluer l'état des performances du système de l'événement que vous examinez. Par exemple, si les performances sont uniformément lentes au moment de l'événement, votre alerte est probablement due à un problème de performances du système.

Pour trouver l'origine du problème à l'aide des chaînes distribuées

  1. Cliquez dans l'onglet Chaînes distribuées pour afficher l'ordre des appels, à savoir la chaîne à laquelle appartient l'événement. Cet onglet vous permet de comprendre comment l'événement que vous examinez a été affecté par d'autres événements de l'application ou des applications connexes.

  2. Dans l'affichage Chaînes distribuées, cliquez sur l'un des appels, ou liens, de la chaîne. S'il existe plusieurs événements pour un même objet, l'Assistant Chaînage s'ouvre. Cet Assistant vous permet de sélectionner les événements possibles à mettre en corrélation dans une chaîne d'événements. Pour démarrer l'Assistant, cliquez sur Suivant.

    Notes

    Obtenez l'horodatage de l'appel que vous sélectionnez afin de pouvoir le coupler avec un événement dans la page suivante.

  3. Dans la page Sélectionner un événement de chaîne possible, sélectionnez l'événement que vous souhaitez examiner. Idéalement, il s'agit de l'événement avec l'horodatage le plus proche de l'appel que vous avez sélectionné dans l'affichage Chaînes distribuées.

  4. Ce que vous voyez ensuite dépend du type de problème que vous examinez. Par exemple, si vous sélectionnez une transaction où un serveur est introuvable, vous pouvez accéder à la page de propriétés de cet événement. Elle vous permet de coupler l'erreur du serveur avec l'événement que vous examiniez initialement. Dans la mesure où il s'agit d'une erreur de serveur, vous savez que le problème ne se trouve pas côté client mais côté serveur. Vous pouvez voir un graphique de l'événement que vous avez sélectionné et obtenir des détails sur l'événement de performances en termes de temps de chargement de la page.

  5. À partir des propriétés de l'événement, cliquez sur l'appel côté serveur, puis cliquez dans l'onglet Compteurs de performance pour plus de détails.

Pour résoudre les problèmes en affichant les événements similaires

  1. Cliquez dans l'onglet Événements similaires pour découvrir si des alertes similaires ont déjà été déclenchées, ce qui pourrait signifier que l'application rencontre des problèmes.

  2. Les événements similaires peuvent être filtrés de différentes façons. Cliquez sur le menu déroulant similaire par pour sélectionner la façon dont vous souhaitez regrouper les événements similaires : par problème, action, classe d'exception ou fonction ayant échoué. Dans les zones de texte De et À, vous pouvez définir la plage de dates des événements similaires que vous souhaitez afficher. Utilisez l'onglet Événements similaires pour découvrir si des alertes similaires ont déjà été déclenchées, ce qui pourrait signifier que l'application rencontre des problèmes.

    - **Filtrage par problème** vous montre les événements similaires qui sont du même type. Par exemple, vous pouvez voir tous les événements similaires où la référence d'objet n'est pas définie sur une instance d'un objet. Cliquez sur le bouton **Affichage des diagrammes** pour découvrir la proportion du nombre total d'événements pour le problème actuel par rapport au nombre total d'événements pour d'autres problèmes. Ces informations vous offrent un aperçu rapide de l'ampleur du problème rencontré par cet événement particulier. Si plusieurs des événements similaires actuels rencontrent le même problème, il peut s'agir d'un problème à résoudre en priorité en raison de son impact sur le nombre d'alertes que vous recevez.
    
    - **Filtrage par Action** regroupe les événements similaires par aspect : sécurité, performances, connectivité et échec d'application. Cliquez sur le bouton **Affichage des diagrammes** pour découvrir le nombre d'événements similaires appartenant à ces catégories et identifier plus facilement celles auxquelles est lié ce problème.
    
    - **Filtrage par classe d'exception** regroupe les événements similaires en fonction de la façon dont vous les avez nommés lors de la configuration. Vraisemblablement, il s'agit des noms qui vous aideraient à identifier leurs types d'exceptions, tels que la classe **System.NullReferenceException**.
    
    - **Filtrage par fonction d'échec** regroupe les événements similaires par la fonction qui émet l'exception. Cela peut signifier qu'il existe un problème avec le point d'entrée.
    

    N'oubliez pas qu'il s'agit d'événements similaires, liés par définition, et ces filtres vous donnent une meilleure idée de la façon exacte dont ils sont liés. Ainsi, à l'aide des filtres Événements similaires, il est possible que la plupart de vos événements aient le même problème que l'événement que vous voyez, qu'il s'agisse d'un problème de performances, qu'ils appartiennent à une classe d'exception que vous avez configurée et que la moitié des événements similaires aient la même fonction d'échec. Action : la fonction va au développeur qui doit mettre à jour le code de fonction.

Pour résoudre des problèmes en affichant des événements connexes

  1. Cliquez sur l'onglet Événements connexes pour afficher les événements qui sont liés par heure. Il s'agit d'exceptions en corrélation avec d'autres événements pouvant vous donner un aperçu du problème.

  2. Pour afficher les détails d'un événement dans la liste, cliquez sur le lien dans la colonne Description.

    Dans les événements connexes, vous pouvez remarquer que le temps de réponse est très lent pour tous les événements pendant un certain temps. Cela peut indiquer un problème avec le système, pas le code, et peut donc aller aux informaticiens pour une solution.