Konvertieren String in Python in Unicode
- Konvertieren Zeichenketten in Python 2 in Unicode
- Konvertieren Sie Zeichenketten in Python 3 in das Unicode-Format
In diesem Tutorial wird das Konvertieren regulärer Zeichenketten in Unicode-Zeichenketten in Python erläutert.
Konvertieren Zeichenketten in Python 2 in Unicode
In Python 2 werden reguläre Strings als Byte-Strings bezeichnet und wir können die eingebaute unicode()
-Funktion verwenden, um diese Byte-Strings in einen Unicode-String umzuwandeln. Dieses Code-Snippet zeigt uns, wie wir in Python 2 einen regulären String in einen Unicode-String umwandeln können.
regular = "regular string"
unicode_string = unicode(regular, "utf-8")
print(type(regular))
print(type(unicode_string))
Ausgabe:
<type 'str'>
<type 'unicode'>
Den regulären Byte-String haben wir mit der Funktion unicode()
in Python 2 in einen Unicode-String umgewandelt.
Konvertieren Sie Zeichenketten in Python 3 in das Unicode-Format
In Python 3 sind Strings standardmäßig Unicode-Strings, und es gibt keine Methode, mit der wir einen regulären String in einen Unicode-String umwandeln können. Daher liefert der folgende Code unterschiedliche Ergebnisse für Python 2 und Python 3.
regular = "regular string"
unicode_string = u"Unicode string"
print(type(regular))
print(type(unicode_string))
Python 2-Ausgabe:
<type 'str'>
<type 'unicode'>
Python 3-Ausgabe:
<class 'str'>
<class 'str'>
Im obigen Code initialisieren wir einen Unicode-String sowohl in Python 2 als auch in Python 3. In Python 2 gehört der String zur Klasse unicode
, weil es einen Unterschied zwischen regulären Strings und Unicode-Strings gibt, während in Python 3 der String gehört zur Klasse str
. Schließlich sind Unicode-Strings die gleichen wie reguläre Strings.
Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.
LinkedIn