Encoder UTF8 en Python

Fariba Laiq 18 aout 2022
Encoder UTF8 en Python

UTF signifie Unicode Transformation Format. Il s’agit d’un système de codage à largeur variable qui code tous les caractères couverts par Unicode dans une chaîne binaire de un à quatre octets.

Il permet la représentation de caractères internationaux comme le chinois. Il est également rétrocompatible avec ASCII.

UTF-8 est principalement utilisé pour encoder les e-mails et les pages Web.

Utilisez encode() pour encoder une chaîne en UTF-8 en Python

En Python, si nous voulons encoder une chaîne en UTF-8, nous utiliserons la méthode encode(). C’est une méthode intégrée qui renvoie la version codée d’une chaîne.

Par défaut, il ne prend aucun argument et convertit la chaîne en UTF-8. Cependant, il peut accepter deux paramètres optionnels, encoding et errors.

Le encoding fait référence à la technique de codage utilisée, et les errors représentent la réponse en cas d’échec du codage. La réponse par défaut est strict, qui déclenche une exception UnicodeDecodeError en cas d’échec.

Dans le code suivant, nous avons encodé le mot Naïve, qui contient un caractère spécial ï. La méthode encode() convertit tout le texte en version UTF-8.

Exemple de code :

string = "Naïve"
print("String before encoding:", string)
print("String after encoding:", string.encode())

Production:

String before encoding: Naïve
String after encoding: b'Na\xc3\xafve'
Auteur: Fariba Laiq
Fariba Laiq avatar Fariba Laiq avatar

I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.

LinkedIn