Encoder UTF8 en Python
UTF signifie Unicode Transformation Format
. Il s’agit d’un système de codage à largeur variable qui code tous les caractères couverts par Unicode dans une chaîne binaire de un à quatre octets.
Il permet la représentation de caractères internationaux comme le chinois. Il est également rétrocompatible avec ASCII.
UTF-8 est principalement utilisé pour encoder les e-mails et les pages Web.
Utilisez encode()
pour encoder une chaîne en UTF-8 en Python
En Python, si nous voulons encoder une chaîne en UTF-8, nous utiliserons la méthode encode()
. C’est une méthode intégrée qui renvoie la version codée d’une chaîne.
Par défaut, il ne prend aucun argument et convertit la chaîne en UTF-8. Cependant, il peut accepter deux paramètres optionnels, encoding
et errors
.
Le encoding
fait référence à la technique de codage utilisée, et les errors
représentent la réponse en cas d’échec du codage. La réponse par défaut est strict
, qui déclenche une exception UnicodeDecodeError
en cas d’échec.
Dans le code suivant, nous avons encodé le mot Naïve
, qui contient un caractère spécial ï
. La méthode encode()
convertit tout le texte en version UTF-8.
Exemple de code :
string = "Naïve"
print("String before encoding:", string)
print("String after encoding:", string.encode())
Production:
String before encoding: Naïve
String after encoding: b'Na\xc3\xafve'
I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.
LinkedIn