異体字・文字包摂の扱いについて整理してみた
異体字(例:髙 vs 高)など、同じ意味を持つ複数の字体がどのように扱われているか。
今時はAIに聞けばわかると思いますが、業務上は確実な出典(引用)が必要なため、関係省庁やガイドラインを整理しました。
文化庁:公用文では「通用字体」を使用(例外:固有名詞の扱い)
文化庁では、公用文における漢字の使用について、常用漢字表の通用字体を用いるよう定めています。
1 漢字使用について
(1) 公用文における漢字使用は、「常用漢字表」(平成22年内閣告示第2号)の本表及び付表による。
字体については通用字体を用いるものとする。
例外:固有名詞の扱い
- 「公用文作成の考え方(建議)」では、地名・人名など固有名詞は常用漢字表の適用外と明示されています。
- 地名は通用している書き方を使用。
- 人名は原則として本人の意思による表記を用いる。
- 特に差し支えなければ、常用漢字表の通用字体、または表外漢字字体表の印刷標準字体を用いることが望ましい。
- 参考: 公用文作成の考え方(建議)HTML / PDF
ウ 固有名詞(地名・人名)には、常用漢字表にない漢字も使うことができる
(ア)固有名詞は、常用漢字表の適用対象ではない。したがって、地名は通用している書き方を用
いる。また、人名は、原則として、本人の意思に基づいた表記を用いる。ただし、必要に応じて
振り仮名を用いる。
(イ)特に差し支えのない場合には、固有名詞についても、常用漢字表の通用字体を用い、また、
常用漢字表にない漢字については、表外漢字字体表の印刷標準字体を用いることが望ましい。
例:
- 「髙」 → 「高」として表記(ただし氏名など例外あり)
総務省:戸籍では「髙」も許容される
戸籍や住民票を扱う総務省では、「髙」は俗字とされ、「高」が通用字体(正字)です。
ただし、「髙」は「俗字」ではあるものの、誤りとはされておらず、戸籍法上は正当な変種として記載可能で、必要に応じて更正を受け付けています。
- 参考: 外字の実態調査に係る調査報告書等の包摂基準書
PDF63ページ「平成2年10月20日付け 法務省民二第5200号通達」
→ 「氏又は名の記載に用いることのできる俗字表」に「髙」が明記
PDF60ページ「平成2年10月20日付け 法務省民二第5200号通達」
第3 戸籍の氏又は名の文字の記載の更正
戸籍の筆頭者氏名欄又は名欄の氏又は名の文字については,次の場合に更正することができ,更正の申出があった場合は,市区町村長限りで更正して差し支えない。
1 更正のできる場合
(1) 通用字体と異なる字体によって記載されている漢字を通用字体の漢字に更正する場合
デジタル庁:文字包摂は優先順位で同定
デジタル庁では、複数の文字データベースを参照し、優先順位に基づいて文字を同定する「文字包摂ガイドライン」が定められています。
6-2 同定先文字を確定させる条件
以下の優先順位に従い、同定先文字を確定する。
① 文字情報基盤文字である
② 戸籍統一文字である
③ 漢字施策(常用漢字)が定義されている
④ 住基ネット統一文字コードがある
⑤ 一意な縮退マップに縮退先が存在する
⑥ 実装した UCS がある
⑦ サロゲート範囲ではない
⑧ 戸籍統一文字番号の若い文字を優先する
⑨ GJ文字番号が若い文字を優先する
例えば、同定の優劣が付けられない同定候補文字が2つあった場合、そのうち1つが文字情報基盤文字
かつ戸籍統一文字であり、もう一方が文字情報基盤文字ではあるが、戸籍統一文字ではない場合は、前者
を同定先として選ぶといったように①の条件から比較を行い、優劣がつけられるまで比較を行う。
※リンク元:地方公共団体の基幹業務システムの統一・標準化
「髙」は文字情報基盤に存在する
「髙」は優先順位①に該当する「文字情報基盤文字」として登録されています。
よって、「髙」はそのままデジタル基盤で使用される可能性があります。
システムを組むときはデジタル庁の優先順位付けが参考になりそう。