Débogage d’une tempête d’interruption
La tempête d’interruption constitue l’un des exemples les plus courants d’un système bloqué. Une tempête d’interruption est un signal d’interruption déclenché par le niveau qui reste dans l’état déclaré.
Les événements suivants peuvent provoquer une tempête d’interruption :
Un appareil matériel ne délivre pas son signal d’interruption après en avoir reçu l’ordre par le pilote de l’appareil.
Un pilote de périphérique n’indique pas à son appareil de délivrer le signal d’interruption, car il ne détecte pas que cette dernière a été lancée à partir de son appareil.
Un pilote de périphérique déclare l’interruption même si celle-ci n’a pas été lancée à partir de son appareil. Cette situation peut uniquement se produire lorsque plusieurs appareils partagent la même IRQ.
Le registre de contrôle au niveau de la périphérie (ELCR) n’est pas défini correctement.
Les appareils déclenchés par des interruptions de périphérie et de niveau partagent une IRQ (par exemple, un port COM et un contrôleur PCI SCSI).
Cet exemple présente une méthode pour détecter et déboguer une tempête d’interruption.
Lorsque l’ordinateur plante, utilisez un débogueur de noyau pour y accéder. Utilisez la commande d’extension !irpfind pour rechercher les IRP en attente. Ensuite, utilisez l’extension !irp pour obtenir des détails sur les IRP en attente. Par exemple :
kd> !irp 81183468
Irp is active with 2 stacks 2 is current (= 0x811834fc)
No Mdl Thread 00000000: Irp stack trace.
cmd flg cl Device File Completion-Context
[ 0, 0] 0 0 8145f470 00000000 00000000-00000000
\Driver\E100B
Args: 00000000 00000000 00000000 00000000
>[ 16, 2] 0 e1 8145f470 00000000 8047f744-814187a8 Success Error Cancel pending
\Driver\E100B ntoskrnl!PopCompleteSystemPowerIrp
Args: 00000000 00000000 00000002 00000002
Cet exemple montre que \driver\e100b n’a pas renvoyé l’IRP pour ntoskrnl ! PopCompleteSystemPowerIrp. Il semble être bloqué et peut être confronté à une tempête d’interruption.
Pour déterminer cela, utilisez la commande kb pour demander une trace de pile. Par exemple :
kd> kb
ChildEBP RetAddr Args to Child
f714ee68 8046355a 00000001 80068c10 00000030 ntoskrnl!RtlpBreakWithStatusInstruction
f714ee68 80067a4f 00000001 80068c10 00000030 ntoskrnl!KeUpdateSystemTime+0x13e
f714eeec 8046380b 01001010 0000003b f714ef00 halacpi!HalBeginSystemInterrupt+0x83
f714eeec 80463c50 01001010 0000003b f714ef00 ntoskrnl!KiChainedDispatch+0x1b
f714ef78 80067cc2 00000000 00000240 8000017c ntoskrnl!KiDispatchInterrupt
f714ef78 80501cb5 00000000 00000240 8000017c halacpi!HalpDispatchInterrupt2ndEnt
Il convient de noter que la section commençant par halacpi!HalBeginSystemInterrupt
est une répartition des interruptions. Si vous utilisez la commande g et que vous y accédez à nouveau, vous verrez probablement une trace de pile différente, mais vous verrez toujours une répartition des interruptions. Pour déterminer l’interruption responsable du blocage du système, examinez le deuxième paramètre transmis à HalBeginSystemInterrupt (dans ce cas, 0x3B). La règle standard veut que le vecteur d’interruption affiché (0x3B) corresponde à la ligne IRQ plus 0x30, de sorte que l’interruption porte le numéro 0xB. L’exécution d’une autre trace de pile peut fournir plus d’informations sur l’appareil qui a émis la demande de service d’interruption (ISR). Dans ce cas, une deuxième trace de pile présente le résultat suivant :
kd> kb
ChildEBP RetAddr Args to Child
f714ee24 8046355a 00000001 00000010 00000030 ntoskrnl!RtlpBreakWithStatusInstruction
f714ee24 bfe854b9 00000001 00000010 00000030 ntoskrnl!KeUpdateSystemTime+0x13e
f714eed8 f7051796 00000000 80463850 8143ec88 atimpab!AtiInterrupt+0x109
f714eee0 80463850 8143ec88 81444038 8046380b VIDEOPRT!pVideoPortInterrupt+0x16
f714eef8 80463818 00000202 0000003b 80450bb8 ntoskrnl!KiChainedDispatch2ndLvl+0x28
f714eef8 80463c50 00000202 0000003b 80450bb8 ntoskrnl!KiChainedDispatch+0x28
f714ef78 80067cc2 00000000 00000240 8000017c ntoskrnl!KiDispatchInterrupt
f714ef78 80501cb5 00000000 00000240 8000017c halacpi!HalpDispatchInterrupt2ndEntry+0x1b
f714f084 8045f744 f714f16c 00020019 f714f148 ntoskrnl!NtCreateKey+0x113
f714f084 8042e487 f714f16c 00020019 f714f148 ntoskrnl!KiSystemService+0xc4
f714f118 804ab556 f714f16c 00020019 f714f148 ntoskrnl!ZwCreateKey+0xb
f714f184 8041f75b f714f1e8 8000017c f714f1d0 ntoskrnl!IopCreateRegistryKeyEx+0x4e
f714f204 804965cd 8145f630 00000000 00000001 ntoskrnl!IopProcessSetInterfaceState+0x93
f714f220 bfee1eb9 8145f630 00000000 8145f5a0 ntoskrnl!IoSetDeviceInterfaceState+0x2b
f714f254 bfedb416 00000004 00000800 0045f570 NDIS!ndisMCommonHaltMiniport+0x1f
f714f268 bfed4ddb bfed0660 811a2708 811a2708 NDIS!ndisPmHaltMiniport+0x9a
f714f288 bfed5146 811a2708 00000004 8145f570 NDIS!ndisSetPower+0x1d1
f714f2a8 8041c60f 81453a30 811a2708 80475b18 NDIS!ndisPowerDispatch+0x84
f714f2bc 8044cc52 80475b18 811a2708 811a279c ntoskrnl!IopfCallDriver+0x35
f714f2d4 8044cb89 811a279c 811a2708 811a27c0 ntoskrnl!PopPresentIrp+0x62
Le système exécute actuellement l’ISR pour la carte vidéo. Le système exécute l’ISR pour chacun des appareils partageant des IRQ 0xB. Si aucun processus ne demande l’interruption, le système d’exploitation attend indéfiniment, demandant aux ISR du pilote de gérer l’interruption. Il est également possible qu’un processus puisse gérer l’interruption et l’arrêter, mais si l’appareil est cassé, l’interruption peut simplement être redéclarée.
Utilisez l’extension !arbiter 4 pour déterminer quels appareils sont sur l’IRQ 0xB. S’il n’existe qu’un seul appareil sur l’IRQ 0xB, vous avez trouvé la cause du problème. Si plusieurs appareils partagent l’interruption (99 % des cas), vous devez isoler l’appareil en programmant manuellement les nœuds LNK (ce qui est destructeur pour l’état du système) ou en supprimant ou désactivant l’appareil.
kd> !arbiter 4
DEVNODE 8149a008 (HTREE\ROOT\0)
Interrupt Arbiter "RootIRQ" at 80472a20
Allocated ranges:
0000000000000000 - 0000000000000000 B 8149acd0
0000000000000001 - 0000000000000001 B 8149acd0
0000000000000002 - 0000000000000002 B 8149acd0
0000000000000003 - 0000000000000003 B 8149acd0
0000000000000004 - 0000000000000004 B 8149acd0
0000000000000005 - 0000000000000005 B 8149acd0
0000000000000006 - 0000000000000006 B 8149acd0
0000000000000007 - 0000000000000007 B 8149acd0
0000000000000008 - 0000000000000008 B 8149acd0
0000000000000009 - 0000000000000009 B 8149acd0
000000000000000a - 000000000000000a B 8149acd0
000000000000000b - 000000000000000b B 8149acd0
000000000000000c - 000000000000000c B 8149acd0
000000000000000d - 000000000000000d B 8149acd0
000000000000000e - 000000000000000e B 8149acd0
000000000000000f - 000000000000000f B 8149acd0
0000000000000010 - 0000000000000010 B 8149acd0
0000000000000011 - 0000000000000011 B 8149acd0
0000000000000012 - 0000000000000012 B 8149acd0
0000000000000013 - 0000000000000013 B 8149acd0
0000000000000014 - 0000000000000014 B 8149acd0
0000000000000015 - 0000000000000015 B 8149acd0
0000000000000016 - 0000000000000016 B 8149acd0
0000000000000017 - 0000000000000017 B 8149acd0
0000000000000018 - 0000000000000018 B 8149acd0
0000000000000019 - 0000000000000019 B 8149acd0
000000000000001a - 000000000000001a B 8149acd0
000000000000001b - 000000000000001b B 8149acd0
000000000000001c - 000000000000001c B 8149acd0
000000000000001d - 000000000000001d B 8149acd0
000000000000001e - 000000000000001e B 8149acd0
000000000000001f - 000000000000001f B 8149acd0
0000000000000020 - 0000000000000020 B 8149acd0
0000000000000021 - 0000000000000021 B 8149acd0
0000000000000022 - 0000000000000022 B 8149acd0
0000000000000023 - 0000000000000023 B 8149acd0
0000000000000024 - 0000000000000024 B 8149acd0
0000000000000025 - 0000000000000025 B 8149acd0
0000000000000026 - 0000000000000026 B 8149acd0
0000000000000027 - 0000000000000027 B 8149acd0
0000000000000028 - 0000000000000028 B 8149acd0
0000000000000029 - 0000000000000029 B 8149acd0
000000000000002a - 000000000000002a B 8149acd0
000000000000002b - 000000000000002b B 8149acd0
000000000000002c - 000000000000002c B 8149acd0
000000000000002d - 000000000000002d B 8149acd0
000000000000002e - 000000000000002e B 8149acd0
000000000000002f - 000000000000002f B 8149acd0
0000000000000032 - 0000000000000032 B 8149acd0
0000000000000039 - 0000000000000039 S 814776d0 (ACPI)
Possible allocation:
< none >
DEVNODE 81476f28 (ACPI_HAL\PNP0C08\0)
Interrupt Arbiter "ACPI_IRQ" at bfff10e0
Allocated ranges:
0000000000000000 - 0000000000000000 B 81495bb0
0000000000000001 - 0000000000000001 814952b0 (i8042prt)
0000000000000003 - 0000000000000003 S 81495610 (Serial)
0000000000000004 - 0000000000000004 B 8149acd0
0000000000000006 - 0000000000000006 81495730 (fdc)
0000000000000008 - 0000000000000008 81495a90
0000000000000009 - 0000000000000009 S 814776d0 (ACPI)
000000000000000b - 000000000000000b S
000000000000000b - 000000000000000b S 81453c30 (ds1)
000000000000000b - 000000000000000b S 81453a30 (E100B)
000000000000000b - 000000000000000b S 81493c30 (uhcd)
000000000000000b - 000000000000000b S 8145c390 (atirage3)
000000000000000c - 000000000000000c 814953d0 (i8042prt)
000000000000000d - 000000000000000d B 81495850
000000000000000e - 000000000000000e 8145bb50 (atapi)
000000000000000f - 000000000000000f 8145b970 (atapi)
Possible allocation:
< none >
Dans ce cas, l’audio, l’Universal Serial Bus (USB), la carte d’interface réseau (NIC) et la vidéo utilisent tous la même IRQ.
Pour savoir quel ISR revendique la propriété de l’interruption, examinez la valeur de retour de l’ISR. Désassemblez simplement l’ISR à l’aide de la commande U avec l’adresse fournie dans l’écran !arbiter, puis définissez un point d’arrêt sur la dernière instruction de l’ISR (qui sera une instruction « ret »). Il convient de noter que l’utilisation de la commande g <address> est l’équivalent de la définition d’un point d’arrêt sur cette adresse :
kd> g bfe33e7b
ds1wdm!AdapterIsr+ad:
bfe33e7b c20800 ret 0x8
Utilisez la commande r pour examiner les registres. En particulier, examinez le registre EAX. Si le contenu du registre EAX indiqué dans l’exemple de code suivant est différent de zéro, cette ISR a revendiqué l’interruption. Dans le cas contraire, l’interruption n’a pas été revendiquée et le système d’exploitation appellera l’ISR suivante. Cet exemple montre que la carte vidéo ne revendique pas l’interruption :
kd> r
eax=00000000 ebx=813f4ff0 ecx=00000010 edx=ffdff848 esi=8145d168 edi=813f4fc8
eip=bfe33e7b esp=f714eec4 ebp=f714eee0 iopl=0 nv up ei pl zr na po nc
cs=0008 ss=0010 ds=0023 es=0023 fs=0030 gs=0000 efl=00000246
ds1wdm!AdapterIsr+ad:
bfe33e7b c20800 ret 0x8
En fait, dans ce cas, l’interruption n’est revendiquée par aucun des appareils sur l’IRQ 0xb. Lorsque ce problème se produit, vous devez également vérifier que chaque composant de l’appareil associé à l’interruption est effectivement activé. Pour le PCI, c’est simple : examinez le registre CMD affiché par la sortie de l’extension !pci :
kd> !pci 0 0
PCI Bus 0
00:0 8086:7190.03 Cmd[0006:.mb...] Sts[2210:c....] Device Host bridge
01:0 8086:7191.03 Cmd[0107:imb..s] Sts[0220:.6...] PciBridge 0->1-1 PCI-PCI bridge
03:0 1073:000c.03 Cmd[0000:......] Sts[0210:c....] Device SubID:1073:000c Audio device
04:0 8086:1229.05 Cmd[0007:imb...] Sts[0290:c....] Device SubID:8086:0008 Ethernet
07:0 8086:7110.02 Cmd[000f:imb...] Sts[0280:.....] Device ISA bridge
07:1 8086:7111.01 Cmd[0005:i.b...] Sts[0280:.....] Device IDE controller
07:2 8086:7112.01 Cmd[0005:i.b...] Sts[0280:.....] Device USB host controller
07:3 8086:7113.02 Cmd[0003:im....] Sts[0280:.....] Device Class:6:80:0
Il convient de noter que le registre CMD de la puce audio (étiquetée « Périphérique audio ») est zéro. Cela signifie que cette dernière est effectivement désactivée à ce moment-là. Cela signifie également qu’elle ne sera pas capable de répondre aux accès par le pilote.
Dans ce cas, la puce audio doit être réactivée manuellement.