Riferimenti all'entità e al carattere
I riferimenti all'entità e al carattere consentono di includere informazioni in documenti XML per riferimento anziché dover digitare i caratteri direttamente nel documento. Tali riferimenti sono utili nei seguenti casi:
Non è possibile digitare direttamente i caratteri in un documento perché verrebbero interpretati come markup.
Non è possibile digitare direttamente i caratteri in un documento a causa di limitazioni del dispositivo di input.
Non è possibile trasportare i caratteri in modo affidabile in un processore che è in grado di elaborare solo caratteri a byte singolo.
Una stringa di caratteri o un frammento di documento è presente più volte e può essere abbreviato.
Per la rappresentazione del contenuto, XML fornisce numerosi costrutti sintattici che iniziano con una e commerciale (&) e terminano con un punto e virgola (;).
I riferimenti al carattere consentono di inserire caratteri Unicode identificati da un numero che punta a un punto di codice Unicode. I punti di codice possono essere identificati attraverso una notazione decimale o esadecimale.
- & #value;
Sintassi utilizzata per riferimenti decimali.
- &# xvalue;
Sintassi utilizzata per riferimenti esadecimali.
Ad esempio, per inserire il simbolo dell'Euro, un carattere che non è ancora disponibile in molti tipi di tastiera, è possibile utilizzare €
oppure €
.
Nella tabella seguente vengono elencate le cinque entità incorporate dei caratteri utilizzati per markup XML.
Entity | Riferimento a entità | Significato |
---|---|---|
lt |
< |
< (inferiore a) |
gt |
> |
> (superiore a) |
amp |
& |
& (e commerciale) |
apos |
' |
' (apostrofo oppure virgoletta singola) |
quot |
" |
" (virgolette doppie) |
Nei casi in cui il carattere può causare un'interpretazione errata della struttura del documento da parte del parser XML, utilizzare l'entità invece di digitare il carattere. I riferimenti all'entità '
e "
sono utilizzati soprattutto nei valori dell'attributo.
Per scrivere Me&You, ad esempio, utilizzare Me&You
. Per a<b, utilizzare a<b
. Per b>c, utilizzare b>c
.
È anche possibile definire entità personalizzate, in modo analogo a ciò che succede in HTML, dove è possibile definire un set di entità da utilizzare in documenti HTML. &ap
os non viene riconosciuto come file HTML. Pertanto, quando si esegue la trasformazione in HTML, è necessario utilizzare $#....
.
Se si sta utilizzando una DTD (Document Type Definition) che dispone di entità predefinite, è possibile farvi riferimento nel contenuto del documento utilizzando la seguente sintassi.
&entityName;