Décoder UTF-8 en Python
L’encodage fait référence à l’encodage d’une chaîne à l’aide d’un schéma d’encodage tel que UTF-8
. Le décodage fait référence à la conversion d’une chaîne codée d’un codage à un autre schéma de codage.
Dans cet article, nous allons apprendre à décoder une chaîne encodée au format UTF-8
en Python.
Décodage de chaînes UTF-8
en Python
Pour décoder une chaîne encodée au format UTF-8
, on peut utiliser la méthode decode()
spécifiée sur les chaînes.
Cette méthode accepte deux arguments, encoding
et error
. encoding
accepte l’encodage de la chaîne à décoder, et error
décide comment gérer les erreurs qui surviennent lors du décodage.
L’argument error
n’accepte que deux valeurs : strict
et ignore
. strict
génère une erreur Unicode
lorsqu’une erreur se produit, et ignore
ignore les erreurs. La méthode decode()
renvoie la chaîne d’origine.
Reportez-vous au code Python suivant pour comprendre comment utiliser la méthode decode()
.
s = "Hello World"
encoded = s.encode("UTF-8")
decoded = encoded.decode("UTF-8")
print("Encoded String:", encoded)
print("Decoded String:", decoded)
Production :
Encoded String: b'Hello World'
Decoded String: Hello World