📊

文系エンジニアが統計学に手を出した

に公開

今回の想定読者

今回のネタは、統計の中でも検定、その中のカイ二乗検定を扱っています。本記事を読んでいただけると、検定やカイ二乗検定の概要を知ることができます。

以下の様な方が想定読者です。

  • 統計に興味があるがまだ何もできていない
  • 検定とたまに聞くが、内容がよくわかっていない
  • カイ二乗検定の概要を知りたい

ログビーの勉強会について

ログビー(Logbii)では、月一回オンラインの社内勉強会をしています。直近のものと、2025年以降のアーカイブを順次公開していきます。

ざっくりと、以下のルールで運用をしています。

  • 月イチで、ランチタイムにオンライン開催(1時間)
  • テーマ自由
  • 持ち回りで開催
  • ランチ代支給(2000円まで)、飲食可
  • 業務時間扱い(業務時間を削る形)でOK

今回の勉強会について

今回は、2025年12月の勉強会アーカイブです。

フロントエンジニアのNiimiさんが発表しました!
それでは、以下本編です。

文系エンジニアが統計学に手を出した

目次

  1. 統計に興味を持ったきっかけ
  2. UX リサーチと統計の関係
  3. 統計の基礎と UX リサーチでの活用
  4. 実践編:カイ二乗検定
  5. まとめ

1. 統計に興味を持ったきっかけ

文系エンジニアの強みを活かしたキャリアパスを ChatGPT に聞いてみたところ、「UX を極めろ」とアドバイスを受けました。 そこから PDM(プロダクトマネージャー)、プロダクトエンジニアを志すようになり、リーン系の書籍を読み漁りました。

  • 『UX リサーチの道具箱』
  • 『リーンスタートアップ』
  • 『LEAN UX』
  • 『LEAN ANALYTICS』

UX リサーチを深堀りしていく中で、定量評価・定性評価の存在を知り、統計(定量評価)に手を出すことになりました。


2. UX リサーチと統計の関係

自分だけの完成では間違っている場合があると痛感しました。小さく作って、実際に使ってもらい、失敗して改善していく。このサイクルが重要だと考えています。 ユーザーの声を定量的・定性的に評価することで、より良いプロダクトを作るための指針が得られると感じました。


3. 統計の基礎と UX リサーチでの活用

統計は、心理学のような文系分野でも広く使われています。データを集めて分析し、傾向や関係性を見つけるための手法です。

おすすめ書籍:『完全独習 統計学入門』

4. 実践編:カイ二乗検定

問題

あなたは、アプリの新しいデザイン(A)と従来のデザイン(B)について、「使いやすい」と感じるかどうかを 100 人のユーザーにアンケートしました。結果は次の通りです。

使いやすい 使いにくい 合計
デザイン A 30 20 50
デザイン B 20 30 50
合計 50 50 100

このデータから、「デザイン A と B で使いやすさの評価に違いがあるか?」をカイ二乗検定で調べてみましょう。


補足:人数が少ない場合の計算例

例えば、10 人で同じ調査をした場合:

使いやすい 使いにくい 合計
デザイン A 3 2 5
デザイン B 2 3 5
合計 5 5 10

判断: 自由度 1 の臨界値 3.84 より小さいので、「統計的に有意な差がある」とは言えません。

人数が少ないと差があっても有意と判断できない場合があります。


補足:なぜ統計的な検定が必要なのか?

表を見ると「A のほうが使いやすい」「B のほうが使いにくい」と感じますが、この違いが「たまたま」起きた可能性もあります。

例えば、100 人のうち数人の意見が偶然偏っただけかもしれません。 統計的な計算(カイ二乗検定)を使うことで、

  • 「この違いは偶然ではなく、本当に意味があるのか?」
  • 「他の人でも同じ傾向が出るのか?」

を客観的に判断できます。

見た目の差が「本物の差」か「偶然の差」かを科学的に確かめるために統計的な検定が必要です。

ステップ 1:仮説を立てる

  • 帰無仮説(H0):デザイン A と B で「使いやすい」と感じる割合に違いはない
  • 対立仮説(H1):デザイン A と B で「使いやすい」と感じる割合に違いがある

コラム:帰無仮説と対立仮説の説明

  • 帰無仮説(H0):まず「違いはない」「効果はない」と仮定します。今回の例では「デザイン A と B で“使いやすい”と感じる割合に違いはない」とします。
  • 対立仮説(H1):「違いがある」「効果がある」と仮定します。今回の例では「デザイン A と B で“使いやすい”と感じる割合に違いがある」とします。

ポイント:最初は「違いはない(帰無仮説)」と仮定して検定を行い、データから「やっぱり違いがありそう(対立仮説)」と判断できるかどうかを調べます。

ステップ 2:期待値を計算する

各セルの期待値(「もし違いがなければ」どうなるか)を計算します。

ステップ 3:カイ二乗統計量を計算する

ステップ 4:有意水準 5%で判断する

計算したχ2の値と、カイ二乗分布表の値(自由度 1 の場合は 3.84)を比べて、違いが「統計的に有意」かどうかを判断します。


補足:なぜ自由度 1 なのか?

この表は「行が 2 つ」「列が 2 つ」の 2×2 表です。 自由度は「(行数 −1)×(列数 −1)」で計算します。

今回の場合:

  • 行数:2(デザイン A、デザイン B)
  • 列数:2(使いやすい、使いにくい)

計算式: (2−1)×(2−1)=1×1=1(2−1)×(2−1)=1×1=1

つまり、2×2 の表なので自由度は 1 になります。 この自由度を使って、カイ二乗分布表の値(臨界値)を調べます。


このように、カイ二乗検定を使うことで「デザインの違いがユーザーの評価に影響しているか?」を客観的に調べることができます。

解答例

ステップ 1:仮説

  • 帰無仮説(H0):デザイン A と B で「使いやすい」と感じる割合に違いはない
  • 対立仮説(H1):デザイン A と B で「使いやすい」と感じる割合に違いがある

ステップ 2:期待値の計算

ステップ 3:カイ二乗統計量の計算

ステップ 4:有意水準 5%で判断

  • 自由度 1 のカイ二乗分布の臨界値は 3.84
  • 計算したχ2(6)は 3.84 より大きいので、「違いがある」と判断できる

結論:

デザイン A と B で「使いやすい」と感じる割合に統計的な違いがあるといえます。


5. まとめ

統計に触れる前、数学コンプレックスが有りました。ただ文系エンジニアでも統計は十分に活用できると感じました。UX リサーチやプロダクト開発において、定量評価の力を身につけることで、より良い意思決定ができると思います。

ディスカッション

  • UX以外に現場で統計を使うならばどのようなものがあるか(パフォーマンス評価など?)
株式会社ログビー(Logbii, Inc.)

Discussion