🎥

TikTokバズり分析:機械学習で解明した「バズる動画の共通点」

に公開

株式会社STAR AIでCEnO(Chief Engineering Officer)のミキマルです。
TikTokしかり、時代はショート動画ではありますが、バズる動画に何か共通的な因子があるのか気になり、分析してみました、という内容になります。

はじめに

TikTokで「バズる/バズらない」を決定づける要因は何か?感覚ではなく、データと機械学習でバズの再現性を見つけることを目的に、最近若年層に人気の某グループのメンバの中からランダムに10名分の投稿動画848件を対象に分析を行いました。

本記事では、特徴量設計、機械学習による重要度分析、そこから得られた示唆、さらにAIを活用したサービス展開案までを技術的にまとめています。

まずは「バズる」を定義

まず数字で表現可能な分析対象を決めます。
フォロワー規模に左右されにくく、クリエイター間の比較がしやすい指標としてエンゲージメントを採用しました。
ココでエンゲージメント率を 動画のいいね数 / ユーザのフォロワー数 と設定し、今回分析対象とした動画のうちエンゲージメントの上位10%を「バズった」と定義してみることにしました。

メンバの投稿動画を確認すると、メンバによって平均エンゲージメントが2倍近く差がついていたり、同じメンバでも動画によってエンゲージメントに差があったりしており、なぜこのような差がうまれるのか、謎は深まるばかり。

分析データと特徴量設計

分析データはTikTokの動画848件、この動画がなぜバズる/バズらないの差がでてくるのか、いくつか仮説をたてて特徴量として設計しました。

今回は以下の観点で合計100以上の特徴量を準備しました。
(一部手作業でのタグ付を実施)

  • 投稿者情報:
    • フォロワー数や、累積いいね数、メディア露出リスト、などユーザの人気を表現するような特徴量
  • 動画のメタデータ(投稿日時・キャプション・尺):
    • 投稿時間、曜日、コメント数、キャプション情報、ハッシュタグ情報、メンション情報、などなど、動画のメタデータに関する特徴量
  • コンテンツ特徴量:
    • 動画に映る髪の長さ、色、内容(ダンス系等)、構図、人数、動画内の文字、エフェクト等、コンテンツの中身に関する特徴量
  • サムネイル特徴量(フレーム抽出→ヒストグラム解析):
    • 動画のメインカラー、 明度、彩度、その分散など、見た目に関する特徴量
  • 音楽特徴量:
    • 楽曲利用遍歴、人気の国、年齢等、利用されている音楽に関する特徴量

バズに効く特徴量はこれだ(機械学習)

まずは無心でLGBMを用いて分類問題としてモデルを構築、重要特徴量を確認しました。

[重要度 TOP 5]

  1. キャプションの長さ
  2. 動画の平均彩度
  3. 動画の平均明度
  4. 動画の色のバラつき
  5. 投稿曜日

色味 × テキスト要素がバズを分ける主要因になっているのがポイント、なのか!?

特徴量ごとの詳細分析

1:キャプションの長さ

バズった動画のキャプションは、1.7〜2倍長い傾向にありました。
また、メッセージ性や感情に関する表現が多い印象。
一方で、非バズ動画は日常報告など短文が多い傾向にありました。
「感情」+「意味のある文章」がエンゲージメントを押し上げています。

正直ホントか?と思ったので以下のような検証を実施しました。

  • イベント発生フラグ特徴量を用意し、キャプション長さとどちらが効いているか確認した。
    結果としては、イベントフラグを導入してもキャプション長のほうが影響度が高かった。
  • 利用単語種類を調査し、キャプション長より効いてる単語がないか確認した。
    こちらも結果として、バズ時のみ現れるような語群はなかった。
    *文字マップを表示してあまり違いがないことを表示

2:サムネイルの色特徴(明度 × 彩度 × 色のばらつき)

可視化から見えた傾向として、安定した中心領域(平均的な色味)でもバズる動画は当然ありつつ、極端な色味(外周領域)でもバズっていることがわかりました。
つまり、“最適な色味” か “他と違う色味” がバズを作る、のかもしれません。
完全なルール化は難しいものの、サムネイルの差別化が一定の影響を持つ可能性が示唆されます。
(知らんけど)

3:投稿曜日・投稿時間

土日・月曜 → ややバズる確率が高い(まあそうかも)

今後の発展案

より本格的に分析を進めていけば、以下のようなアプリケーションイメージも実現できると思っています。

  1. バズりキャプション自動生成AI:投稿テーマ(例:イベント、結果報告)を入力すると、バズり確率の高い文体・適切な文字数を反映したキャプションを生成

  2. キャプションのバズりスコア診断AI:入力キャプションに対して、バズりスコアおよび改善提案を生成+過去の類似バズ事例もご案内

  3. 色味補正 × サムネイル自動生成AI:動画を読み込むと、「明度・彩度調整案」を行い、バズりやすいサムネ候補を生成、色特徴の改善アドバイスなどをご案内

本分析に興味がある方、サービスを一緒に作っていっていただけるパートナー企業様、いらっしゃいましたらぜひご連絡ください!

担当:株式会社STAR AI ミキマル
問い合わせ先:info@star-ai.jp

Discussion