Python에서 UTF8 인코딩
Fariba Laiq
2022년8월18일
UTF는 유니코드 변환 형식
을 나타냅니다. 유니코드에 포함된 모든 문자를 1~4바이트의 이진 문자열로 인코딩하는 가변 너비 인코딩 시스템입니다.
중국어와 같은 국제 문자의 표현을 허용합니다. 또한 ASCII와 하위 호환됩니다.
UTF-8은 주로 이메일 및 웹 페이지를 인코딩하는 데 사용됩니다.
encode()
를 사용하여 Python에서 UTF-8로 문자열 인코딩
Python에서 문자열을 UTF-8로 인코딩하려면 encode()
메서드를 사용합니다. 인코딩된 버전의 문자열을 반환하는 내장 메서드입니다.
기본적으로 인수를 사용하지 않고 문자열을 UTF-8로 변환합니다. 그러나 encoding
및 errors
라는 두 개의 선택적 매개변수를 허용할 수 있습니다.
encoding
은 사용된 인코딩 기술을 나타내며 errors
는 인코딩 실패 시 응답을 나타냅니다. 기본 응답은 실패 시 UnicodeDecodeError
예외를 발생시키는 strict
입니다.
다음 코드에서는 ï
이라는 특수 문자가 포함된 Naïve
라는 단어를 인코딩했습니다. encode()
메소드는 전체 텍스트를 UTF-8 버전으로 변환합니다.
예제 코드:
string = "Naïve"
print("String before encoding:", string)
print("String after encoding:", string.encode())
출력:
String before encoding: Naïve
String after encoding: b'Na\xc3\xafve'
작가: Fariba Laiq
I am Fariba Laiq from Pakistan. An android app developer, technical content writer, and coding instructor. Writing has always been one of my passions. I love to learn, implement and convey my knowledge to others.
LinkedIn