💡

text LM(GPT-3, BART)によるアドリブメロディ生成結果

2023/06/17に公開

この記事について

去る2023/2に[AIミュージックバトル!『弁財天』]というアドリブ生成AI作成コンテストに参加しました。

そこで、私は自然言語で事前学習されたGPT-3, BARTをfine-tuningして、
アドリブ生成モデル(AI)を作成しました。

作成したtext生成LMによるアドリブ生成AIの概要図
AIのシステム図

詳しい手法は別記事で解説予定です。(といってだいぶ時間が経っていますが・・・)

この記事ではコンテスト中に、生成されたアドリブの音源集となります。

オルガンのパートが生成されたメロディーです。

生成アドリブ集

サンプル

https://youtu.be/3Tr8-f3TMgI

シンコペーションっぽいのが入っているものの、
音の動きが小さく、中間部分から同じ音を繰り返す傾向があり、アドリブとしては面白みにかけます。

実際の提出音源

予選

予選音源1

入力コード

|Am | Am/Ab | Am/G | Am/F# |
| F | C | Dm7 | Edom7 |
| Am |

https://www.youtube.com/watch?v=gELTA6pF8KE

伴奏のブルージな雰囲気にあったフレーズが生成できていてよさげです。

予選音源2

入力コード

|C G | Am | F C | G |
|C G | Am | F G | C |
|C |

https://www.youtube.com/watch?v=NpacmMnYYC8

伴奏の穏やかな雰囲気にはあっているのですが、少し退屈に感じます。

本選

本選1回戦Aブロック

入力コード

|C | G/B  | Bb | F/A |
|F/Ab | C/G | D/F# | G |
|C |

https://www.youtube.com/watch?v=gELTA6pF8KE

前半は割とよさげですが、後半リズムも音程もずれて、くずれてしまっています。

LateSubmission

本番で提出したものではなく、後からお題を使って生成したやつです。

本選1回戦Bブロック用(battle2)

https://youtu.be/hc7oP20T_Vc

明るい曲調にはあっているものの、真ん中らへんの音の外し方が目立ちますね。

本選1回戦Cブロック用(battle3)

https://youtu.be/F09bVSUKIzk

最後に音の動きが少ないのが惜しい。

本選1回戦Dブロック用(battle4)

https://youtu.be/ewt1JyoOky4

スケールが外れているのと、音が高すぎますね。

本選2回戦ABブロック用(battle5)

https://youtu.be/DXlcKpnvoZ8

うーん、単調な気がします。

本選2回戦CDブロック用 (battle6)

https://youtu.be/YIcZEK_mgTo

これはかなり苦しいですね。後半頑張って誤魔化そうとしている感がすごいですね笑。
(お題の中でも難しい方だったとは思います。)

本選決勝用 (battle7)

https://youtu.be/cA5aP6dn0NA

アドリブにしては音の動きが少ない上に、マイナーキーに合わない明るいメロディーになってしまっています。

個人的な感想

個人的には、わりと遊びでtextのLMにアプローチを縛っていたのに、
他の参加者がベースとして使っていたmagentaのImprov RNNに
引けを取らない出来となったのは意外でした。

ちゃんと前半から後半にかけて展開を作れているのが、
プログラムらしくない感じがあり驚きでした。

とはいえ後半になるにつれハーモニーやリズムのずれが目立ちがちです。  
(これでも後処理で補正はかけているのですが)
そこを徹底して改善できるとよさそうでした。

Discussion