자바스크립트의 유니코드

Shiv Yadav 2023년10월12일
자바스크립트의 유니코드

이 문서는 JavaScript에 유니코드 문자를 삽입하는 방법을 이해하는 데 도움이 됩니다.

자바스크립트의 유니코드

ES2015 사양에 따르면 소스 코드 텍스트는 유니코드(버전 5.1 이상)를 사용하여 표현됩니다. 소스 텍스트는 U+0000에서 U+10FFFF까지의 코드 포인트로 구성됩니다.

소스 코드를 저장하거나 교환하는 방법은 ECMAScript 표준에서 중요하지 않습니다. 그러나 종종 UTF-8로 인코딩됩니다.

JavaScript에 유니코드 문자를 삽입하는 방법에는 두 가지가 있습니다. 유니코드 이스케이프 시퀀스 및 String.fromCodePoint 사용.

유니코드 이스케이프 시퀀스

문자열 이스케이프 시퀀스는 코드 포인트 번호를 기반으로 코드 단위를 전달합니다.

JavaScript의 3가지 이스케이프 유형:

  1. 16진법 이스케이프
  2. 유니코드 이스케이프
  3. 코드 포인트 이스케이프

Omega를 삽입하려면 유니코드 이스케이프 시퀀스 \u{XXXXXX}를 사용하여 유니코드 코드 포인트를 이스케이프할 수 있습니다(여기서 XU+0000에서 U+10FFFF까지의 범위에서 1-6개의 16진수를 나타냄, 전체 유니코드를 포함함).

예를 들어 Omega, 즉(U+03A9)를 JavaScript 문자열에 삽입하려면 다음과 같이 하면 됩니다.

const ome = 'Omega: \u{03A9}';
console.log(ome);

코드 실행

출력:

"Omega: Ω"

유니코드는 BMP(Basic Multilingual Plane)에 포함되지 않은 추가 문자를 포함하도록 성장했습니다. 이러한 문자는 이전 버전의 JavaScript에서 직접 추가할 수 없는 코드 포인트인 대리 쌍으로 표시됩니다.

이러한 문자를 적절하게 나타내려면 두 개의 인접한 유니코드 이스케이프 시퀀스가 ​​필요합니다.

JavaScript에서 String.fromCodePoint() 사용

String.fromCodePoint() 함수를 사용하여 JavaScript 문자열에 유니코드 코드 포인트를 추가할 수 있습니다. 일련의 코드 포인트(10진수, 16진수, 8진수 등)를 입력으로 사용합니다.

예를 들어, 십진수 코드 포인트를 사용하여 Omega를 표시합니다.

const omee = `Omega: ${String.fromCodePoint(937)}`;
console.log(omee);

코드 실행

출력:

"Omega: Ω"
작가: Shiv Yadav
Shiv Yadav avatar Shiv Yadav avatar

Shiv is a self-driven and passionate Machine learning Learner who is innovative in application design, development, testing, and deployment and provides program requirements into sustainable advanced technical solutions through JavaScript, Python, and other programs for continuous improvement of AI technologies.

LinkedIn