Open2

unicode, ivs, code point,

qatocoqatoco

「文字列」の章で紹介したように、JavaScriptは文字コードとしてUnicodeを採用し、エンコード方式としてUTF-16を採用しています

絵文字を含む特定の文字を扱う際や「文字数」を数えるという場合には、内部コードであるUTF-16を意識しないといけない

Unicodeはすべての文字(制御文字などの画面に表示されない文字も含む)に対してIDを定義する目的で策定されている仕様です。 この「文字」に対する「一意のID」のことをCode Point(符号位置)と呼びます。

Code Pointは\u{Code Pointの16進数の値}のようにエスケープシーケンスとして記述できます

JavaScriptの文字列の構成要素はUTF-16で変換されたCode Unit(符号単位)

uフラグをつけた正規表現は、文字列をCode Pointが順番に並んだものとして扱います
uフラグをつけていない正規表現は、文字列をCode Unitが順番に並んだものとして扱っています

https://jsprimer.net/basic/string-unicode/

qatocoqatoco
  • Unicode
    • code point
    • Unicodeエスケープシーケンス
      • \u{code pointの16進数の値} or "\u<utf-16 のcode unit>"
      • 数値リテラル: 0x{code pointの16進数の値}
        • es2015以降 code pontを渡せるようになった