🙆

🎵 Suno v5 楽曲プロンプト設計書(メタタグ,metatag)

に公開

🎵 Suno v5 楽曲プロンプト設計書

はじめに:AIに「音楽を設計」するという発想

Suno v5は、テキストから高品質な楽曲を生成できる最新のAI音楽ツールです。
しかし、AIは“魔法の作曲家”ではありません。
優れた結果を得るには、あなたが「何を」「どんな雰囲気で」「どう聴かせたいか」を、
具体的かつ構造的に伝える必要があります。

そのために必要なのが―― 「設計書(プロンプト)」 です。

Suno v5は、v4.5以上にプロンプトへ忠実です。
“おもちゃ”から“楽器”へと進化しました。
アプローチの核心は、Style/Lyrics/除外(ネガティブ)という3つの役割を完全に理解し、
適切な情報を適切な順序で与えることにあります。

🎬 楽曲制作の4ステップ

Sunoで曲を作る流れは、以下の4ステップで構成されます。
どのステップも「AIに設計を伝える」意識が重要です。


STEP 1:コンセプトを定義する(曲の魂を言語化)

項目
テーマ 夏の終わりの切ない恋/深夜のドライブ/応援歌
ジャンル J-Pop/Rock/Lo-fi/EDM/Classical など
雰囲気(Mood) 切ない/壮大/静謐/攻撃的/神秘的 など
使用楽器の重心 ピアノ中心/ギターが主役/シンセ厚め/ストリングスでドラマ
音像(Production) Stereo Wide/Intimate Close-Mic/High Dynamic Range など

例:「80年代日本のシティポップ風で、都会の夜景を見ながらドライブしているような、少しノスタルジックな曲」


STEP 2:プロンプトを設計・記述する

Suno v5はプロンプト解釈が精密です。
Style→Lyrics→除外 の3要素で制御します。

要素 役割
Styleプロンプト 楽曲の骨格(ジャンル/ムード/BPM/楽器群/音像)
Lyricsプロンプト 構成・歌詞・演出タグ(抑揚/楽器の出入り/転調/展開)
除外(ネガティブ) ありがち混入要素の明確な排除

STEP 3:生成→試聴→差分修正→再生成

  • ズレは原因別に補正:

    • 音色・ジャンル・テンポのズレ:Style側を修正
    • 構成・抑揚・出音タイミングのズレ:Lyrics側を修正
    • 不要要素の混入:除外を追加
  • 一度に直すのは1〜3点まで。差分が明確なほど結果が安定します。


🎨 Styleプロンプト設計(骨格・音像の宣言)

最小構成の例(自然文)

80s Japanese City Pop, nostalgic, Rhodes piano and synth bass, medium tempo, stereo wide, clean and glossy
Acoustic ballad, female vocal, intimate close-mic, slow tempo, warm and airy

「ジャンル+ムード+主楽器+テンポ+音像」を1文で詰めるのがコツ。
v5は短く強い指示ほど正確に再現します。


応用編:JSON構造化

{
  "genre": "80s Japanese City Pop, Modern City Pop",
  "mood": ["nostalgic", "romantic", "night drive"],
  "bpm": 108,
  "key": "E Minor",
  "instruments": {
    "keys": "Rhodes electric piano (lush, chorus)",
    "bass": "synth bass (round, groovy)",
    "guitar": "clean electric (comping, subtle)",
    "drums": "vintage drum machine (tight, not aggressive)"
  },
  "production": {
    "stereo_image": "wide but balanced",
    "dynamics": "high dynamic range",
    "tone": "clean, glossy, tape saturation light",
    "reverb": "plate reverb (short to medium)"
  },
  "language": "Japanese"
}

JSON形式のメリット(階層化と個別制御)

JSONは “フォーム入力”のようにAIへ意味を渡す 形式です。
自然文よりも誤解が少なく、以下の利点があります。

  1. 意味の一意化
    “ジャンル・楽器・音像”を明示的に区別でき、曖昧な解釈を防げます。
  2. 階層化による精密制御
    [instruments] の中で各楽器を個別指定可能。
    例:「鍵盤は温かいがドラムはドライ」などの差分表現が可能。
  3. 再利用性とテンプレート化
    コピペで再利用しやすく、チーム共有も容易。
  4. 差分更新が簡単
    [bpm]だけ変更など、要素単位で比較テストができる。
  5. モジュール化と優先制御
    [production]ブロックを音像モジュール化可能。
  6. 可読性・教育性
    どの指示がどの結果を生んだか読み返しやすい。

結論:JSONは誤読を防ぎ、差分設計と再現性を最大化する。
v5の「忠実な解釈」との相性は非常に良い。


✍️ Lyricsプロンプト設計(構成・演出の中核)

構成タグ(メタタグ)

タグ 役割
[Intro] 導入
[Verse] Aメロ(物語)
[Pre-Chorus] Bメロ(橋渡し)
[Chorus] サビ(主題)
[Bridge] Cメロ(転換)
[Interlude] 間奏
[Drop] EDM的落差
[Buildup] 高揚前段階
[Theme] 主題提示
[Theme Reprise] 主題再提示
[Outro] 終結

演出タグ(拡張版)

🎤 ボーカル表現

  • (whispering):ささやく
  • (softly):優しく
  • (powerfully):力強く
  • (sadly):哀しげに
  • (spoken):語り
  • (breathy):息多め
  • (octave double):オクターブ重ね
  • (harmonies: third above):3度上のハモり
  • (call and response):掛け合い
  • (ad-libs):アドリブ的合いの手

🎸 楽器・編成

  • [Instrument: Acoustic guitar (fingerstyle, gentle)]
  • [Instrument: Strings (legato, warm)]
  • [Instrument: 80s synth lead (delay dotted-8th)]
  • [Layer: add pads] / [Layer: remove pads]
  • [Mute: drums] / [Solo: piano]
  • [Unison: bass & synth]

🎚 ダイナミクス・密度

  • (building up)(hold tension)(explode)
  • (sparse arrangement)(thick arrangement)
  • (pp)(ff)でも可

🕒 リズム・テンポ感

  • (half-time groove)
  • (double-time feel)
  • [Time Signature: 7/8]
  • [Swing: light]

🎹 ハーモニー・調性

  • [Key: E Minor]
  • [Modulation: +1 semitone at last chorus]
  • [Cadence: plagal]
  • コード指定例:[Am7] 君の [G] 横顔 [Cmaj7] 見ていた [F]

🌌 空間・音像

  • (intimate close-mic)
  • (stereo wide)
  • (dry)(cavernous reverb 4s)
  • (tape saturation light)
  • (low-pass filter intro)

⚡ トランジション・FX

  • [FX: reverse cymbal rise]
  • [FX: noise sweep up]
  • [Transition: tape stop]
  • [Beat Stop: 1 bar silence]

🏁 構造・終結

  • [Double Chorus]
  • [Breakdown]
  • [Vamp: 4 bars]
  • [Cold Ending]
  • [Fade Out]

🚫 除外プロンプト(ネガティブプロンプト)

AIが自動で混入しやすい「ありがちな要素」を排除します。
Styleプロンプトと組み合わせることで、思い通りの楽曲作成ができます。

ケース 指定例
ダークフォークで陽気要素回避 upbeat, happy, banjo, hand claps
モダンCity Popで過度な80s排除 synth brass, slap bass, overly 80s sound
Lo-fiで声素材除外 vocals, rap, spoken word, vocal samples

的外れな除外(例:クラシック曲からメタルを除外)は無意味です。


🈳 歌詞の読み間違いを防ぐテクニック(日本語向け)

Sunoは漢字やひらがなですら、読み間違えをするため、
日本語歌詞ではかな表記またはローマ字表記を活用すると精度が向上します。

🎙 ひらがな化の例

まちのひかりが ながれていく
まどに かさなる みずのせん

「感じ方」は損なわれますが、**音声的誤読(例:‘は’を‘ha’と読むなど)**が防げます。
日本語母音が強調され、メロディとの整合性が良くなる場合もあります。

💡 助詞「は」問題(重要)

「は」は日本語でwaと発音されます。
AIはこれを「ha」と読むことが多いため、ひらがな歌詞やローマ字表記では “wa” と明記します。

元の書き方 推奨表記 理由
わたしは わたしwa 発音「わ」を明示
これは これwa 誤読「これハ」防止
はな hana (名詞)/wa (助詞) コンテキストで使い分け

推奨方法

  • 完全日本語詞の場合 → ひらがな歌詞
  • 歌詞の英語混在・テンポ重視の場合 → ローマ字歌詞(助詞はwa)

🎧 サンプル集

🎵 J-Pop(ボーカルの抑揚に注目)

https://suno.com/song/d3ae1804-244e-45cb-b4d8-3c6c939f8138

🎸 UK Garage × Deep House(mood & elementsによる制御)

https://suno.com/song/e8fcf9db-48a2-4b26-a01c-bfaaf86de144

🎸 Progressive Metal(プログレ的構造をメタタグで再現)

https://suno.com/song/94b76249-9cc4-43de-8610-b8de830825a0

🎶 Progressive House(構成・展開に注目)

https://suno.com/song/35563d34-7730-469b-8884-aa83203dea61


🎼 まとめ:Suno v5は「指揮に応える楽器」

Suno v5は、あなたの**設計(プロンプト)に忠実に反応する“楽器”**です。
AIが演奏する音は、あなたの言葉(設計)そのもの。

  • Style/Lyrics/除外の役割を理解する
  • JSONで階層化し、Lyricsで抑揚を設計する
  • 日本語ではひらがな/ローマ字で精度を上げる

Sunoはあなたの代わりに作るのではなく、
あなたの音を正確に奏でる共演者です。

Discussion