🍣
旧字体を新字体に変換する
まとめ
- ikawaha/kanji モジュールに旧字体を新字体に変換する機能を増やしました
- いくつかの漢字の旧字体の判定が間違っていました(なおした)
旧字体を新字体に変換する
元ネタはこれです。
これで統制できるのはだいぶ限られた範囲かも知れないけど、確かにあったら便利だなと思ったので、旧字体を新字体に変換する strings.Replacer
を利用できるようにしました。
いくつかの旧字体の判定が間違っていた
折角なので、旧字体の判定のテストも足しておこう、と思ったら 🤔 となりました。
文化庁の常用漢字表から旧字体364字を拾っていたのですが、このうちのいくつかが、Unicode正規化されて勝手に(←私の知らぬところでという意味で)新字体になってしまっていました。まぁ、要するにバグなんですが・・・
諸, 祥, 神, 塚, 都, 福, 隆, 朗
の8字がそれです。これを調整したものを入れてあります。
誰も使わない趣味だけのライブラリに、誰も使わない機能を追加して、誰も気づかなかったバグを直したお話しでした。
Happy hacking!
Discussion