Python で文字列を Unicode に変換する
このチュートリアルでは、Python で通常の文字列を Unicode 文字列に変換する方法について説明します。
Python 2 で文字列を Unicode に変換する
Python 2 では、通常の文字列はバイト文字列と呼ばれ、組み込みの unicode()
関数を使用してこれらのバイト文字列を Unicode 文字列に変換できます。このコードスニペットは、Python 2 で通常の文字列を Unicode 文字列に変換する方法を示しています。
regular = "regular string"
unicode_string = unicode(regular, "utf-8")
print(type(regular))
print(type(unicode_string))
出力:
<type 'str'>
<type 'unicode'>
Python 2 の unicode()
関数を使用して、通常のバイト文字列を Unicode 文字列に変換しました。
Python 3 で文字列を Unicode 形式に変換する
Python 3 では、文字列はデフォルトで Unicode 文字列であり、通常の文字列を Unicode 文字列に変換する方法はありません。したがって、次のコードは Python 2 と Python 3 で異なる結果をもたらします。
regular = "regular string"
unicode_string = u"Unicode string"
print(type(regular))
print(type(unicode_string))
Python 2 の出力:
<type 'str'>
<type 'unicode'>
Python 3 の出力:
<class 'str'>
<class 'str'>
上記のコードでは、Python 2 と Python 3 の両方で Unicode 文字列を初期化します。Python 2 では、通常の文字列と Unicode 文字列に違いがあるため、文字列はクラス unicode
に属しますが、Python 3 では文字列クラス str
に属しています。結局のところ、Unicode 文字列は通常の文字列と同じです。
Maisam is a highly skilled and motivated Data Scientist. He has over 4 years of experience with Python programming language. He loves solving complex problems and sharing his results on the internet.
LinkedIn