Caractères d'échappement
Mise à jour : novembre 2007
La plupart des opérateurs importants du langage des expressions régulières sont des caractères simples sans séquence d'échappement. Le caractère d'échappement \ (une seule barre oblique inverse) indique à l'analyseur d'expression régulière que le caractère situé après la barre oblique inverse n'est pas un opérateur. Par exemple, l'analyseur traite un astérisque (*) comme un quantifieur de répétition et une barre oblique inverse suivie d'un astérisque comme le caractère Unicode 002A.
Les caractères d'échappement énumérés dans le tableau suivant sont acceptés aussi bien dans les expressions régulières que dans les modèles de remplacement.
Caractère d'échappement |
Description |
||
---|---|---|---|
Caractères ordinaires |
Les caractères autres que . $ ^ { [ ( | ) * + ? \ ne correspondent qu'avec eux-mêmes. |
||
\a |
Correspond à une alerte sonore \u0007. |
||
\b |
Correspond à un retour arrière \u0008 s'il figure dans une classe de caractères [] ; sinon, consultez la remarque située après le tableau. |
||
\t |
Correspond à une tabulation \u0009. |
||
\r |
Correspond à un retour chariot \u000D. |
||
\v |
Correspond à une tabulation verticale \u000B. |
||
\f |
Correspond à un défilement de ligne \u000C. |
||
\n |
Correspond à une nouvelle ligne \u000A. |
||
\e |
Correspond à un caractère d'échappement \u001B. |
||
\040 |
Correspond à un caractère ASCII codé en octal (trois chiffres au plus) ; les nombres ne comportant pas de zéros non significatifs sont des backreferences s'ils ne sont composés que d'un seul chiffre ou s'ils correspondent à un numéro de groupe de capture. (Pour plus d'informations, consultez Backreferences.) Par exemple, le caractère \040 représente un espace. |
||
\x20 |
Correspond à un caractère ASCII utilisant la représentation hexadécimale (codage sur deux chiffres). |
||
\cC |
Correspond à un caractère de contrôle ASCII ; par exemple, \cC correspond à Ctrl-C. |
||
\u0020 |
Correspond à un caractère Unicode utilisant la représentation hexadécimale (codage sur quatre chiffres).
|
||
\ |
Représente, lorsque ce caractère d'échappement est suivi d'un caractère non identifié comme caractère d'échappement, le caractère lui-même. Par exemple, \* est identique à \x2A. |
Remarque : |
---|
Le caractère d'échappement \b constitue un cas particulier. Dans une expression régulière, le caractère \b désigne une limite de mot (comprise entre les caractères \w et \W) sauf s'il figure dans une classe de caractères [], où \b fait référence au caractère de retour arrière. Dans un modèle de remplacement,\b correspond toujours à un retour arrière. |