😀

ロケールを無視して並べ替える(Unicode異体字など)

2024/10/27に公開

sortコマンドはロケールを考慮してくれます。そのため異体字などが含まれる場合、並べ替えた順番が必ずしも同じにならないかもしれません。複数のファイルを全て同じ基準で並べ替えて比較したい場合には、それが妨げになる場合もあります。
そういう場合にはロケール(locale)を無視して、sortするように、ちょっとだけ工夫します。

LC_ALL=C sort file.txt

LC_ALL=C.utf8ではありません。LC_ALL=Cです。これによりutf-8などのロケール(locale)を考慮しない並べ替えになります。
以上です。

Discussion