Caractères d'échappement en HTML
Dans ce didacticiel, nous allons en apprendre davantage sur les échappements de caractères HTML. De plus, le didacticiel présentera les caractères qui doivent être échappés en HTML.
Introduction aux caractères d’échappement en HTML
Nous utilisons des caractères d’échappement dans les langages de balisage tels que HTML, XML et XHTML pour représenter les caractères Unicode à l’aide des caractères ASCII.
Les caractères d’échappement surviennent lorsque nous devons représenter des caractères tels que <
, >
, utilisés dans les langages de balisage. Si nous n’échappons pas à ces caractères, les règles de balisage seront perturbées et nous n’obtiendrons pas le résultat souhaité.
Divers caractères Unicode peuvent être échappés en HTML. Certains des caractères qui peuvent être échappés sont "
, '
, <
, >
, &
, etc.
La liste des entités HTML peut être trouvée ici. Ces personnages peuvent être représentés principalement de deux manières.
Ce sont des références de caractères numériques et des références de caractères nommés. Les références de caractères numériques peuvent être représentées sous forme de références de caractères numériques décimaux et hexadécimaux.
Regardons l’exemple suivant, qui montre la représentation d’un espace insécable en utilisant les différentes références de caractères.
Exemple de code :
<p> Hi Jack ! </p> <!-- named character references -->
<p> Hi Jack ! </p> <!-- hexadecimal numeric character references -->
<p> Hi Jack ! </p> <!-- decimal numeric character references -->
Production :
Comme on le voit dans l’exemple ci-dessus, les références de caractères nommés, les références de caractères numériques hexadécimaux et les références de caractères numériques décimaux de l’espace insécable sont
,  
et  
. respectivement. On peut remarquer que les références de caractères numériques commencent par les caractères &#
et se terminent par ;
.
En HTML, il existe différents contextes dans lesquels certains caractères doivent être échappés. Certains des contextes sont le corps du document et les attributs intérieurs, les balises de style et de script, etc.
Caractères qui doivent être échappés en HTML
Cette section traitera des caractères qui doivent être échappés en HTML. Il ne faut pas manquer trois caractères pour s’échapper en HTML. Ce sont:
- (
<
) - (
>
) - (
&
)
Les langages de balisage comme HTML et XML constituent des symboles plus grands et plus petits, <
et >
, également appelés emballages fiscaux. Nous devrions échapper ces enveloppes de syntaxe dans le corps du document ; sinon, la syntaxe de balisage sera perturbée.
La référence de caractère de nom de l’encapsuleur de syntaxe est indiquée ci-dessous.
- (
<
)&lt;
- (
>
)&gt;
Ici, nous verrons les conditions dans lesquelles les personnages ne sont pas échappés et comment nous pouvons échapper aux personnages.
Dans l’exemple ci-dessous, dans la première balise <a>
, nous avons écrit le texte ``the tagentre les balises
`.
Par conséquent, l’hyperlien ne s’applique qu’au caractère the
car il a été entouré de deux balises <a>
.
Mais, ce n’est pas notre but. Notre objectif est d’afficher uniquement la balise <a>
. Il est donc nécessaire d’échapper aux enveloppes de syntaxe autour de la balise <a>
.
Nous avons donc utilisé les références de caractères <
et >
pour échapper aux enveloppes syntaxiques. La référence <a>
représente la balise <a>
.
Par conséquent, dans la deuxième balise <a>
de l’exemple ci-dessous, un lien hypertexte est appliqué à l’ensemble du texte, the <a> tag
. C’est pourquoi nous devrions échapper aux wrappers de syntaxe en HTML.
Exemple de code :
<a href="#"> the <a> tag </a> <br>
<a href="#"> the <a> tag </a>
Production :
Le symbole esperluette est utilisé comme premier caractère pour écrire le caractère de référence des caractères Unicode tout en échappant les caractères. Mais, si nous devons afficher le caractère de référence d’un caractère Unicode particulier en HTML, nous devons échapper le symbole esperluette.
L’exemple est illustré ci-dessous.
Exemple de code :
<p> The character reference of the symbol < is &lt; </p>
Production :
Notre objectif est de montrer le caractère de référence équivalent du symbole <
, <
. Mais quand on écrit la référence <
, elle est convertie en <
dans le navigateur.
Pour représenter le caractère de référence du nom, nous devons échapper le symbole esperluette dans la référence <
. Après avoir échappé à l’esperluette, nous pouvons écrire les caractères restants comme d’habitude, comme indiqué dans l’exemple ci-dessus.
Cet article nous a appris pourquoi nous devons échapper les caractères et quels caractères doivent être échappés en HTML. Nous avons également appris les références de caractères de nom et les références de caractères numériques.
Sushant is a software engineering student and a tech enthusiast. He finds joy in writing blogs on programming and imparting his knowledge to the community.
LinkedIn