👳‍♀️

[全部ア段にすると古典インドっぽくなる]は本当なのか?

に公開

はじめに

全部ア段にすると古典インドっぽくなるというのは言語学的にも正しいのか というツイート[1]を見かけたため、本当に古典インドの言語にはア段が多く、ア段にすると古典インドっぽくなるのかを確認します。
今回はもっとも著名な古典インドの言語であるサンスクリット語で検証します。

プログラミング言語「Scratch」を使用します。

そもそもサンスクリット語とは

古代インドで広く使われていた言語。仏教やヒンドゥー教などの聖典や文学などに使われ、現在の北インドで広く使われるヒンディー語などの祖語。

使用するデータの用意

wiktionaryの操作

今回使用するのは、wiktionaryにあるサンスクリット語の頻出単語リストAppendix:Sanskrit frequency list 1からWikiマークアップ形式のテキスト[2]を取り出してtxt形式で保存します。

pc上での操作

txtファイルエディタを開いて、一行目からの

{| class="wikitable sortable"
|-
! Sanskrit word !! Transliteration (IAST) !! Grammar !! Frequency
|-

と、一番下の

|}

[[Category:Sanskrit appendices]]

の部分を削除して上書き保存します。

Scratch上の操作

Scratchのリストに移動して、「読み込み」を選択します。

その後、ポップアップ「どの欄を使いますか」には4を入力し、IAST転写[3]された8748単語をリストに格納します。

aの数を調べるプログラムを作成

  • 母音のうち二重母音au,aoがIAST表記法には含まれるが、それらはデーヴァナーガリでは別の文字として与えられるため排除します。


結論

このコードで8748単語を解析したところ、サンスクリット語に使われる母音のうち およそ69% がaであった。

また、すべての母音がア段で構成されている単語を調べる[4]と、2879単語 = およそ33% がそれに該当した

つまり、全部ア段にすると本当に古典インドっぽくなる ということがわかりました。

補足

アメリカの言語学者 W. D. Whitney著のSanskrit Gramamar Chapter II には、こう書かれています。

  1. The a-vowels are the prevailing vowel-sounds of the language, being about twice as frequent as all the others (including diphthongs) taken together.

訳:a母音は当該言語において最も頻繁に現れる母音音であり、二重母音を含む他の全ての母音より二倍の頻度で現れる。

今回の結果もこれに即していることが分かります。

脚注
  1. 黛勺銑/Mayuzumi Shakusen」さんの引用ツイート
    https://x.com/M_Shakusen/status/1989952040421003529?s=20 ↩︎

  2. Appenedix:Sanskrit frequency list 1 ↩︎

  3. IAST表記法とは、デーヴァナーガリをラテン文字に転写したもの。IPAとは別。 ↩︎

  4. このブログには写真は添付していませんが、ここから[中を見る]でプログラムを閲覧できます。 ↩︎

Discussion