Convertir cadena a Unicode en Python
Este tutorial analizará la conversión de cadenas regulares en cadenas Unicode en Python.
Convertir cadenas a Unicode en Python 2
En Python 2, las cadenas regulares se conocen como cadenas de bytes y podemos usar la función integrada unicode()
para convertir estas cadenas de bytes en una cadena Unicode. Este fragmento de código nos muestra cómo podemos convertir una cadena normal en una cadena Unicode en Python 2.
regular = "regular string"
unicode_string = unicode(regular, "utf-8")
print(type(regular))
print(type(unicode_string))
Producción :
<type 'str'>
<type 'unicode'>
Convertimos la cadena de bytes normal en una cadena Unicode con la función unicode()
en Python 2.
Convierta cadenas a formato Unicode en Python 3
En Python 3, las cadenas son cadenas Unicode de forma predeterminada y no existe ningún método para convertir una cadena normal en una cadena Unicode. Por lo tanto, el siguiente código da resultados diferentes en Python 2 y Python 3.
regular = "regular string"
unicode_string = u"Unicode string"
print(type(regular))
print(type(unicode_string))
Salida de Python 2:
<type 'str'>
<type 'unicode'>
Salida de Python 3:
<class 'str'>
<class 'str'>
En el código anterior, inicializamos una cadena Unicode tanto en Python 2 como en Python 3. En Python 2, la cadena pertenece a la clase unicode
porque hay una diferencia entre las cadenas normales y las cadenas Unicode, mientras que en Python 3, la cadena pertenece a la clase str
. Después de todo, las cadenas Unicode son las mismas que las cadenas normales.
Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.
LinkedIn