🎞️

ハリウッドで最も高い収益を挙げた作品の可視化と分析

に公開

目的

この記事では、Tableau のスキルアップを目的とし、Tableau Public 上にホストされている「Hollywoods Most Profitable Stories」を可視化し、分析した結果を紹介します。😏

背景

Tableau のDATA SABAR プログラム の学習の一環で、独自のViz を作り、Tableau Public にアップする必要があります。e-Stat から統計データを探し、分析するつもりでしたが、興味のある統計データが思った以上に、クレンジングに時間が掛かりそうだったため、手早く使えそうな「Hollywoods Most Profitable Stories」を使い、分析することにしました。 😅

Hollywoods Most Profitable Storiesとは

Tableau Public のサンプル データページによると、出自は InformationIsBeautiful.net で、2007年〜2011年の間に公開されたハリウッド映画のデータです。作品名、制作会社、公開年、ジャンル、全世界での興行収入、オーディエンス・スコア、映画評論サイト Rotten Tomatoes のスコアのデータが含まれています。詳細は後述しますが、この期間に公開された全ての映画を網羅している訳ではなく、ジャンルや作品には偏りがあります。 🤔

分析の設計

Tableau のスキルアップが目的だったため、背景の設定は行いませんでした。代わりに以下の問いを設定し、探索的分析(EDA)を行いました。

  • 制作会社毎の興行収入、利益率は、どうなっているのか?
  • ジャンル毎の興行収入、利益率は、どうなっているのか?
  • 作品毎の興行収入、利益率は、どうなっているのか?
  • 作品毎に見た時、興行収入とオーディエンス・スコアに相関関係はあるのか?

結論

観察事項

制作会社毎の興行収入、利益率は、どうなっているのか?

  • 制作会社毎に興行収入を比べると、「Warner Bros.」がトップの2,081 百万ドル、「Disney」が次いで1,978 百万ドル、「Independent」が3位で1,526 百万ドル、「Summit」が4位の1,242 百万ドル、「Universal」が5位の1,152 百万ドルでした。
  • 又、作品毎に利益率をプロットすると、多くの作品の利益率は、0〜20%以下である ことが分かりました。
  • 一部例外として、Disneyの「High School Musical 3: Senior Year」は22.91%、Independent の「Fireproof」は66.93%という極めて高い利益率を記録している ことが分かりました。🫨

ジャンル毎の興行収入、利益率は、どうなっているのか?

  • ジャンル毎に興行収入を比べると、「Comedy」が最多の5,286 百万ドル、次いで「Romance」が1,973 百万ドル、「Drama」が1,287 百万ドル、「Animation」が1,070 百万ドル、「Fantasy」は285 百万ドル、「Action」は 93百万ドルの順でした。
  • 尚、このデータセットには 「Fantasy」、「Action」ジャンルの作品は、それぞれ1作品しか収録されていませんでした。 😓
  • 高い利益率を記録した二つの作品「High School Musical 3: Senior Year」は「Comedy」、「Fireproof」は「Drama」ジャンルの作品でした。

作品毎の興行収入、利益率は、どうなっているのか?

  • 作品毎にパフォーマンスを比較すると、Summit の「The Twilight Saga: New Moon」の興行収入が最多の709.8百万ドルで、利益率は14.20%でした。
  • 2位は Independent の「Twilight: Breaking Dawn」で、興行収入は702.2 百万ドル、利益率は6.38%でした。
  • 3位は Universal の「Mamma Mia!」で、興行収入が609.5 百万ドル、利益率は9.23%でした。
  • 平均興行収入は、141.9 百万ドルで、平均利益率は4.78 %でした。 🤔
  • 平均興行収入以上を売り上げた作品は全70作品中、26作品に留まり、平均利益率を上回った作品は、18作品でした。

全世界での興行収入と、オーディエンス・スコアに相関関係はあるのか?

  • 興行収入とオーディエンス・スコアの相関を見ると、緩やかな正の相関 が観察されました。🤔
  • 又、作品の多くはオーディエンス・スコア、45〜70%の間に分布している ことが分かりました。
  • 一方、オーディエンス・スコアの高い作品の興行収入が高いとは必ずしも言い切れず、例えば「A Dangerous Method」は、オーディエンス・スコアは89%と高かったにも関わらず、興行収入は9.0 百万ドルに留まっています。
  • 尚、興行収入1位の「The Twilight Saga: New Moon」のオーディエンス・スコアは78%、第2位の「Twilight: Breaking Dawn」は68%、第3位の「Mamma Mia!」は76%でした。
  • 作品によってオーディエンス・スコアと Rotten Tomatoes スコアの付き方に違いが観察されました。「The Twilight Saga: New Moon」のRotten Tomatoes でのスコアは27%、「Twilight: Breaking Dawn」は26%でした。

観察から得られた示唆

  • 北米に於けるメインストリームの映画産業は、一部の作品を除き、利益率は軒並み20%以下で、平均利益率は4.74%と、薄利なビジネスである ことが伺えました。
  • 今回のデータには Fantasy、Action ジャンルは、それぞれ一作品しか含まれておらず、ジャンルに偏りがある ことが分かりました。
  • オーディエンス・スコアの高い作品の興行収入が高いとは必ずしも言えず、オーディエンス・スコアが平均値以上でも、興行収入が平均以下の作品も数多く見受けられました。
  • 制作会社によってオーディエンス・スコアと、Rotten Tomatoes のスコアの付き方に違いが観察されました。特にIndependent の作品は、違いが顕著に観察されました。「The Twilight Saga: New Moon」や「Twilight: Breaking Dawn」等、商業的に成功した作品は、Rotten Tomatoes のスコアが低く、 逆に「I Love You Philip Morris」、「Rachel Getting Married」は高スコアであったにも関わらず、商業的には成功したとは言い難い作品でした。 (いわゆる通ウケする作品でしょうか。) 🤔

打ち手

  • 一定期間のまとまったデータがあれば、ジャンル毎の市場規模の推移等、より実用的な分析ができそう だと感じました。
  • 又、既存の属性に加え、監督名や出演者名、作品の長さ(分数)、公開館数、広告宣伝費、制作費等のデータもあれば、より制作会社各社のマーケティング施策に活かせる分析ができそう だとも感じました。🤔

学び

今回の分析を通じ、得られた学びは、以下の通りです。

  • 問いを設定すると、意味のある分析設計になる と感じました。
  • 英語表記のカラムを、日本語にすることで、作業効率が上がりました。
  • 分析手法は、データに依存する ことが分かりました。今回は、メジャーのディメンション化、アナリティクス ペインの平均線や傾向線、ダッシュボード フィルター・アクションを使いました。😏
  • BigQuery 等のクラウド基盤上にテーブルを作り、Tableau を接続し、分析するのも面白そうです。
  • 当面は、探索的分析(EDA)のスキルを磨くため、Tableau の訓練を続けます。ゆくゆくは特徴量作り、モデル開発・評価までを、手早くできるようになりたい と考えています。🤔
  • Tableau の強みは、クイックに分析できる機動力の高さ にあり、今後も「ビジュアル・アナリティクスのフレームワーク」に沿いながら、手早く、分析から示唆出し、アウトプットの公開(共有)までの一連の訓練を続けたいと考えています。😁

出所

Discussion