📑

ユニコード正規化で、文字の揺れをおさえる

2023/04/25に公開

ユニコードで表された文字は、見た目が似ていてもコードポイントが異なる場合があります。ユニコード正規化は、同一コードポイントに変換する処理となります。

やってみた

pp "@".unicode_normalize # => "@"

RubyのString#unicode_normalizeを使いました。

感想

ユニコード以前に、そもそも文字コードを分かっていないな。。。

Discussion