UTF-8 in Python decodieren

Vaibhav Vaibhav 21 Dezember 2022
UTF-8 in Python decodieren

Kodierung bezieht sich auf die Kodierung eines Strings mit einem Kodierungsschema wie UTF-8. Decodieren bezieht sich auf das Konvertieren einer codierten Zeichenfolge von einer Codierung in ein anderes Codierungsschema.

In diesem Artikel lernen wir, wie man eine im UTF-8-Format kodierte Zeichenfolge in Python dekodiert.

Dekodierung von UTF-8-Strings in Python

Um eine im UTF-8-Format codierte Zeichenfolge zu decodieren, können wir die für Zeichenketten angegebene decode()-Methode verwenden.

Diese Methode akzeptiert zwei Argumente, encoding und error. encoding übernimmt die Codierung des zu decodierenden Strings und error entscheidet, wie mit Fehlern umgegangen wird, die beim Decodieren auftreten.

Das Argument error akzeptiert nur zwei Werte: strict und ignore. strict löst einen Unicode-Fehler aus, wenn ein Fehler auftritt, und ignore ignoriert die Fehler. Die Methode decode() gibt den ursprünglichen String zurück.

Sehen Sie sich den folgenden Python-Code an, um zu verstehen, wie die Methode decode() verwendet wird.

s = "Hello World"
encoded = s.encode("UTF-8")
decoded = encoded.decode("UTF-8")
print("Encoded String:", encoded)
print("Decoded String:", decoded)

Ausgabe:

Encoded String: b'Hello World'
Decoded String: Hello World
Vaibhav Vaibhav avatar Vaibhav Vaibhav avatar

Vaibhav is an artificial intelligence and cloud computing stan. He likes to build end-to-end full-stack web and mobile applications. Besides computer science and technology, he loves playing cricket and badminton, going on bike rides, and doodling.