漢字異体字のいりぐち
Zennの記事に異体字の話がぜんぜんなさそうなので書いてみます。
環境によって文字ちゃんと表示されなかったらすまんです。
というか私もこの記事を書き足してるAndroidで一部文字が豆腐になってしまっていますw
少なくともWindowsならちゃんと出るはず…!
そもそも異体字ってなんやねん
文字の方言みたいなものです。
正字(=政府とかが定めるオフィシャル文字)ではない文字を指します。
そもそも文字に「正しい形」などありはしないですが(思想)、歴史的にオフィシャル文字を定めるのは利便性の面でも統治者の権威を示す面でも重要でした。
たとえば「国」の異体字は引くほどあります。
まぁ、国家として統一したほうがいいのは当然。
現代の日本の正字は明治から昭和にかけて整備されました。
さらにさかのぼると中国の康熙字典(1716年)が嫌でも出てきます。
このあたりがJIS文字やUnicodeに出てくる漢字系の文字のネタ元になっています。
ちなみに康煕字典は現代でも購入可能です。
異体字のCoolな所
†中二心†をくすぐられます。
- 無⇒无
- 帰⇒歸、皈
- 陰陽⇒阴阳、阥阦
どうですか???
異体字の困る所
ITとの相性が最悪です。
Excel名簿から様々なバリエーションのサイトウさんとワタナベさんを検索するのを想像してください。
(JISだろうがUnicodeだろうが文字の形ごとになる文字コードが割り当てられてるのは一緒)
また氏名や地名の「本来の文字」をPC・ブラウザ上で取り扱えないケースもあります。
「髙」(はしご高)や「𠮷」(つち吉)などです。
牛丼の吉野家も「 𠮷 野家」が正式ですが、彼らのWEBサイトのページタイトルは普通の「吉」が使われているようです。
異体字が発生する主なパターン
① 技術上の都合
近世に至るまで「正しい文字」にアクセスすることは容易ではないです。複製ミスは当然あります。
偏(部首)とツクリの位置関係が違ってるパターンが好きです。
- 秋⇒秌
- 松⇒枩
他にも「駄目」を「䭾目」と書くシーンは現代でもわりと見ますね。
ちなみにこれ康煕字典にも載ってます。
ミス以外でも似た形で細部が違うものも沢山あります。
筆運びが難しい形や石に刻みづらい形を変えたり、視認性の都合から似た字と区別するためだったり。
- 魚⇒𩵋
- 土⇒圡、𡈽(これは元々「士」と区別するための点だそう)
② ショートハンド
繰り返し系を略したり文字が合体したりします。
昔の日本語は縦書きが基本だったので縦に合体します。
- 澁⇒渋
- 品⇒𠯮、𠮰(これかわいい)
- 久米⇒粂
- 菩薩⇒𦬇
「𦬇」(ササぼさつ)は写経とかで文字を書きまくる僧侶が「菩薩」って書くのしんどくて生まれたそうです。いちばん略しちゃいけない箇所な気がしますが「観音」も元は「観世音菩薩」の略らしいので仏様は寛大なのでしょう。
③ 忌避
何らかの理由で一般的な文字を使いたくない時に違う書き方をします。
現代日本だと検索よけで記載をあえて変えてるのが近いです。
(☆を@にかえてください)
有名な例は本能寺です。
「能」の字は「ヒ=火」が付いているということで、🔥本能寺の変🔥以降のように書かれるようになったそうです。
その他、「殺」系とかも直接的な表現を避けるためかバリエーション豊富です。
なお古代中国では皇帝の名前(諱:いみな。真名みたいなもの)はその死後に使用禁止になったというのが有名です。(⇒Wikipedia:避諱)
例えばクニを表す文字は「邦」が本来でしたが、劉邦の死後使えなくなりなんやかんやあって「国」が定着したとかです。
ただこれは日本ではあまり見られません。むしろ足利将軍や豊臣秀吉は臣下に自分の名前の1字をプレゼントするのを外交ツールとしていました。
(戦国武将の名前が似たようなのばっかりなのは主にこのせい)
※日本でも避諱をやらせてた時期はちょっとはあるらしい(Wikipedia:避諱欠画令)
他にも昔の偉い人が勝手に新字を創造したり、謎マナーにより「様」のバリエが豊富にあったりなど話題は多数ありますがいったんこのあたりにしておきます。
多くの方がご存じの通り文字周りはIT技術者にとって底なし沼です(私も異体字は好きだけど文字コードは嫌い)。
ですが異体字は親しんでみると民俗学的な好奇心をそそられるポイントが沢山あります。いい沼です。ぜひいっしょに漬かりましょう。
参考文献
本記事の内容はだいたいこの辺の本を読んだ記憶で書きました。とても面白い本なので沼の入門にぜひ。
Discussion