🍣

旧字体を新字体に変換する

2022/11/22に公開

まとめ

  • ikawaha/kanji モジュールに旧字体を新字体に変換する機能を増やしました
  • いくつかの漢字の旧字体の判定が間違っていました(なおした)

旧字体を新字体に変換する

元ネタはこれです。

https://developers.prtimes.jp/2022/11/18/change_word_form/

これで統制できるのはだいぶ限られた範囲かも知れないけど、確かにあったら便利だなと思ったので、旧字体を新字体に変換する strings.Replacer利用できるようにしました

いくつかの旧字体の判定が間違っていた

折角なので、旧字体の判定のテストも足しておこう、と思ったら 🤔 となりました。

文化庁の常用漢字表から旧字体364字を拾っていたのですが、このうちのいくつかが、Unicode正規化されて勝手に(←私の知らぬところでという意味で)新字体になってしまっていました。まぁ、要するにバグなんですが・・・

諸, 祥, 神, 塚, 都, 福, 隆, 朗

の8字がそれです。これを調整したものを入れてあります。

https://github.com/ikawaha/kanji

誰も使わない趣味だけのライブラリに、誰も使わない機能を追加して、誰も気づかなかったバグを直したお話しでした。

Happy hacking!

Discussion