✏️

短歌条例と短歌の境界

commits7 min read

この記事のねらい

短歌条例と短歌の境界はどこにあるのだろう。

短歌条例というのは57577の短歌のリズムを繰り返して書き進められた詩のことだ。名前のもとはラーメンズのわりと有名なネタからきているらしい。Twitterの #短歌条例 というタグをたどると、画像付きのツイートにまとめられた作品をたくさん見ることができる。

「ネネネ」はそんな短歌条例をつくる人で、作品の数も多く、短歌条例というジャンルのもつ雰囲気を決定づけているといってもよい作家のひとりだ。以前に「蓼食う本の虫」というブログサイト内で短歌条例の連載をしていたこともあって、そちらでも作品を見ることができる。

http://tadeku.net/author/nenene

彼女の作品も含めて、短歌条例として公開されている作品には、ある独特の雰囲気があるように思う。そこで語られている内容は、たとえば恋愛感情に関することだったり、ショートショートのような空想っぽい物語だったりとさまざまだけれど、その空気感というか、語り口のようなものはどことなく短歌とは異なるものを感じる。この記事ではその異なりはどこからくるものなのかを検討してみたい。

分析の対象

そのための手がかりとして、一般的な短歌と短歌条例の語り口の分析をおこない、両者を比較することにした。何が一般的な短歌・短歌条例なのかは正直よくわからないけれど、分析のためのデータとして先ほど挙げたリンク先のネネネの短歌条例15篇と、複数の作者による現代短歌256首を用意した。

短歌条例については、Twitterに投稿されている作品の多くが画像として投稿されたものであるため、内容をテキストデータとして得ることが難しい。その一方で、先ほど挙げたリンク先の連載記事は作品を画像とともに記事本文中に掲載していたため、利用しやすいものだった。短歌条例のサンプルとしてネネネの作品だけに偏ってしまう点に問題はあるものの、彼女は短歌条例というジャンルのもつ雰囲気をよく代表する作家のひとりであるように思われたため、今回は彼女の作品だけを利用することにした。

現代短歌については、この記事の筆者がつくった作品300首程度と、以下の工藤のブログ記事で紹介されている72首を準備した。

http://blog.livedoor.jp/mk7911/archives/52227365.html

ただし、いずれについても分析に使用した解析器による解析で「未知語」が含まれていると判定される作品については分析の都合上除外した。このため、実際にはこの記事の筆者がつくった作品290首と、その他の現代歌人による作品66首をサンプルとして利用している。

方法

今回は、分析対象の短歌・短歌条例のなかでの語の共起関係に注目することにした。だが、ただ単語の共起関係を分析したのでは、両者の語り口の異なりの検討材料にすることは難しい。そこで、作品中の単語(形態素)の一部を一定のルールにしたがって記号に置き換えることで、トークンの共起関係の分析からそのジャンルの語り口のもつ癖を観察できるようにした。具体的には、CaboCha(IPA辞書)を用いて係り受け解析をおこない、各作品を文節単位に分割(トークン化)しながら、一部の単語についてはその品詞の種別に応じて記号に置き換える処理を施した。また、記号化されない単語についてはIPA辞書に収録されているその単語の原形に置き換えた。以下に品詞ごとの記号化のルールを挙げる。

  • サ変動詞(スル)=> SuV
  • 形容動詞語幹 => NaADJ
  • 代名詞 => PRO
  • 感動詞 => INT
  • 副詞 => ADV
  • 名詞 => N
  • 形容詞 => ADJ
  • 動詞 => V

短歌については作品ごとにひとつの「文」として、短歌条例はブログ記事本文の1行ごとにひとつの「文」として解析し、得られた文書の集合をコーパスにした。短詩系の文学作品をどのような分量でひとつの文書としてカウントしてコーパスに格納するかは実際は判断が難しく、とりわけ短歌条例はもともと句読点が多用される傾向があるため、改行をもとに分けるよりも句点にもとづいて分けたほうが文としては正しい分け方になりうるのだが、短歌を作品ごとにひとつの「文」としたこととの分量的な対応を考慮したうえで、今回はこのようなかたちで文書集合をもつことにした。コーパス全体の文書数は556で、そのうち200が短歌条例(グループ1)、66が工藤の紹介した現代短歌(グループ2)、290が筆者の短歌作品(グループ3)である。

頻度の分析

得られた文書集合について、文節をひとつひとつのトークンとして、トークンの集計をおこなった。このような集計処理をおこなうとき、文書集合内のひとつひとつの文が極端に長かったり短かったりすると、長い文ほどトークンが観察されやすく、また、短い文ほどトークンが観察されにくくなってしまう。そのため以下では、長い文中で観察されたトークンは相対的に少なく観察されたものとして、短い文中で観察されたトークンは相対的に多く観察されたものとして集計されるように重みづけをおこなっている(TF-IDFによる重みづけ)。

コーパス全体を通じて文節の数を集計した結果が下図である(出現数が上位30位までの文節のみ掲載している)。

画像1

また、グループごとに同様に集計した結果が下図である(上から順にグループ1、グループ2、グループ3)。

画像2

画像3

画像4

こうした処理をおこなうときには、句読点などの記号類はあらかじめ文中から削除するのがふつうなのだが、短詩系の文学作品においてはそれらが表現の特徴としてあらわれることが少なくないため、ここではそのままにしている。そのため、たとえばグループ1(短歌条例グループ)では「。」という記号を含む文末表現にあたる文節が比較的多くカウントされている。

ただこれらの図は、グループ内において、ある文節が他の文節よりどれくらい多く・少なく出現するかを確認するのには役立つものの、いま分析対象としているコーパスではグループごとの文書数に明らかな差があるため、グループ間で文節の出現数の比較をするのにはあまり役に立たない。

そこで、短歌条例グループ(グループ1)において、その他のグループよりも出現数が比較的多く相対的に「重要」な違いをもたらしていると考えられる文節について、その重要度の順に下図にまとめた(Keynessと呼ばれる指標にもとづいている)。

画像5

この図から、Vと助詞の「た」からなる文節は、「。」が付く文末の表現であるかにかかわらず、その他のグループよりもむしろ短歌条例においてこそ特徴的に多く出現するものであることがうかがえる。また「Vない。」や「Vないた。」(助動詞の「ない」は原形に置き換えられているため、もとは「Vなかった。」に相当するもの)といった表現についても、短歌条例に特徴的に用いられていることがわかる。

いままで見ていた文節を機械的に単語(に近しい単位)へと分割したものをひとつひとつのトークンとしたうえで、上と同じ指標を計算し、その順にまとめたものが下図である。

画像6

すでに指摘したように短歌条例はもともと句読点が多用される傾向があるため、句読点が短歌条例グループに特徴的なものとして表れている。「Vた」や「Vないた」といった表現の重要度から示唆されたように、助詞の「た」や助動詞の「ない」は、やはり短歌条例において特徴的な表現なのだと考えられる。また、文節の重要度だけからは見通しにくかった点として、形容動詞語幹が短歌条例において特徴的な表現であるらしく、文節の重要度とあわせて考えると、「NaADJだ」という表現が比較的多用されていることがうかがえる。

実際に「NaADJだ」という文節の出現数を確認したところ、短歌条例グループでは200ある文書中に20件あった一方で、筆者の短歌グループでは290ある文書中で13件、その他の現代短歌グループでは66ある文書中でわずか1件しか確認されなかった。「NaADJだ」という文節は国語文法における形容動詞に相当するもので「NaADJな」や「NaADJに」といった活用形もこれに含まれる(IPA辞書の品詞体系では形容動詞という品詞カテゴリは存在せず、このような扱いになっているため)。今回のコーパスには短詩系文学作品でない、いわゆる「ふつうの文章」が含まれていないため、そもそもふつうならばどのくらいの頻度で使われるものなのかわからないのだが、どうやら形容動詞はむしろ短歌だとふつうの文章のようには頻繁に用いられないということがいえるのかもしれない。

つながりの分析

ここまでは文節の出現する頻度に注目して見てきたが、頻繁に出現するトークンが実際にどのように使われているかを検討するにはトークンどうしのつながり方を確認する必要があるだろう。そこで、以下に、各グループでそれぞれ頻出するトークンをノードとしたネットワーク図を掲載していく(上から順にグループ1、グループ2、グループ3)。

画像9

このようなネットワーク図では一般にまとまりの中心付近にあるノード(=図中の点のこと)のほうが周縁にあるノードよりも多くのエッジ(=図中の線のこと)と絡んでいる。それぞれのエッジは、ここでは順番の前後は問わず、結びつけている文節どうしが直接隣りあう関係にあることを表している。エッジの太さは関係の強さで、ここでは太いほど隣りあわせになっている頻度が単純に多いということを表している。ただし、これらのエッジは出現するすべての隣りあう関係を示すものではなく、一定の回数以上の頻度で出現したものだけ取り上げている。

画像8

画像9

先ほどグループ1での重要度が高いものだった「Vた」という文節に注目してみると、「Vた」の係り先になると考えられる「N」や「PRO」を含むノードはグループ1ではそれほど多くない。これと比較してグループ3では「NN」という名詞どうしの複合を含む文節があったりと、「Vた」の係り先になると考えられるノードの数が多い。グループ2は複数の作者による作品が混在しているため、そこに語り口の癖が表れているのか判断しにくいが、ここではそもそも「Vた」というノードが図中に存在せず、それほどよく使われる文節ではないことがわかる。また、グループ3は概観としてエッジが交絡しているようすが密に見えるが、同じようにひとりの作者の作品で構成されているグループ1ではそれほどエッジの交絡が密に見えない。図中で描画されるエッジの数が多いということは、それだけ一定の回数以上出現した隣りあう文節の組み合わせが多いということなので、グループ3を基準に考えるならば、グループ1では隣りあう文節の組み合わせのパターンがむしろそれほど多くないということがいえる。

まとめ

以上のことを総合すると、まず、短歌条例は短歌に比べると、同じような文節の組み合わせを同じように繰り返しながら書き進められる文学作品だということが指摘できるかもしれない。また、助詞の「た」と形容動詞が用いられることが比較的多く、内容として過去のことについて現在における語り手の視点からその様態を叙述するような語り口が多いのだと考えられる。

句読点が多用されることも含めて、こうしたいわば小説的ともいえる語り口で書き進められるためか、「Vない。」や「Vないた。」といった「ない」を含む文末表現も多く用いられている。

このような考察のほとんどは、実際に短歌条例として公開された作品を眺めていたのでもなんとなく感得できるものかもしれない。しかし、この記事でやったようにデータとして定量的に分析することでよく見えてくることもあり、たとえば形容動詞はむしろ短歌においてはそれほど用いられないということなどはその一例だろう。以上のようなことが短歌条例と短歌との雰囲気の違いのすべてというわけではないだろうが、その違いに迫るための着眼点として、ぜひ参考にされたい。

GitHubで編集を提案

Discussion

ログインするとコメントできます