UTF-8 in Python decodieren
Kodierung bezieht sich auf die Kodierung eines Strings mit einem Kodierungsschema wie UTF-8
. Decodieren bezieht sich auf das Konvertieren einer codierten Zeichenfolge von einer Codierung in ein anderes Codierungsschema.
In diesem Artikel lernen wir, wie man eine im UTF-8
-Format kodierte Zeichenfolge in Python dekodiert.
Dekodierung von UTF-8
-Strings in Python
Um eine im UTF-8
-Format codierte Zeichenfolge zu decodieren, können wir die für Zeichenketten angegebene decode()
-Methode verwenden.
Diese Methode akzeptiert zwei Argumente, encoding
und error
. encoding
übernimmt die Codierung des zu decodierenden Strings und error
entscheidet, wie mit Fehlern umgegangen wird, die beim Decodieren auftreten.
Das Argument error
akzeptiert nur zwei Werte: strict
und ignore
. strict
löst einen Unicode
-Fehler aus, wenn ein Fehler auftritt, und ignore
ignoriert die Fehler. Die Methode decode()
gibt den ursprünglichen String zurück.
Sehen Sie sich den folgenden Python-Code an, um zu verstehen, wie die Methode decode()
verwendet wird.
s = "Hello World"
encoded = s.encode("UTF-8")
decoded = encoded.decode("UTF-8")
print("Encoded String:", encoded)
print("Decoded String:", decoded)
Ausgabe:
Encoded String: b'Hello World'
Decoded String: Hello World