📘

JIS X 0208 の第一水準・第二水準を判定する関数を追加してみた

2022/12/18に公開

はじめに

タイトル出落ち、というやつです。

第一水準・第二水準漢字

JIS X 0208 は、JIS 基本漢字などと呼ばれる、日本語表記、地名、人名などで用いられる6879文字の文字セットです。世の中には UI こそ刷新されていても、バックエンドはいにしえのコードセットで動き続けているシステムもあり、基本漢字に含まれない文字を受け取れなかったりするシステムに出会うことも稀にあると思います。

そんな訳で、文字が JIS X 0208 に含まれるかどうかをチェックするモジュールを用意しています。

https://github.com/ikawaha/jisx0208

このうち、第一水準と呼ばれる文字セットと、第二水準と呼ばれる文字セットがあり、これを判定する関数を追加しました。

追加した理由は Gophers Slack でそんな関数があるかという質問が出ていたから、というだけです。

もはや第一水準と第二水準とが必要だった経緯とか、分かりようもない時代に突入している気はしますが、まだどこかには、メモリの制約のために第一水準の漢字しか扱えないハードがあったりするでしょうか? 漢字ROMなんてのがやはりまだどこかで使われているでしょうか?

単にコードを書くためだけに書いた感は否めませんが、どこかで何かの役に立つといいですね。

Happy hacking!

Discussion