🐨

【図解】機械学習と統計学って何が違うの?

2022/04/25に公開約4,200字

普段は YouTube で機械学習について発信しています。お時間ある方は覗いていただけると喜びます。

https://www.youtube.com/channel/UCbCHn_q5MUAz5ZDNA-wKsug

ディープラーニング の前に。

ディープラーニングは「統計学」がベースとなっています。統計学は、実はいろいろな場面で使われていて、私たちの知らないところで、人類の生活を豊かにしてくれています。


統計学はディープラーニングの基礎

統計学を極めることで、未来の出来事を予測したり、人間には難しい判断をすることもできます。このような、「予測」や「判断」といった統計手法は、 機械学習の分野に繋がっていきます。

今回は、まず、機械学習とは、どのようなことなのか。
そして、統計学と機械学習の関係性や違いについて解説します。


DeepLearning の基礎を本にまとめています。手に取って頂けるととても喜びます ↓

https://zenn.dev/nekoallergy/books/904df952389317


皆さんの理解が一歩でも進むと嬉しいです。



Created by NekoAllergy

そもそも機械学習ってなんなの?


機械学習とは、機械が自動で学習してくれる手法のこと

はじめに、機械学習とはなんなのかを解説します。

機械学習とは、なんらかの問題を解くために、機械が自動で学習してくれる手法のことです。ここでの「問題を解く」とは、未来を予測したり、アイテムを分類したりすることを指します。

また、機械とは、皆さんが使っているパソコンやスマホのようなコンピュータのことを指します。つまり、簡単に言うと、「パソコンにめっちゃ計算させることで、予測したり分類したりしよう!」というのが、機械学習です。


機械学習を使うことで、予測したり分類したりする AI が作れる

たとえば、コンビニの翌日の売上を予測したり、画像に写っているものを判別したりする問題は、機械学習を使って解くことができます。最近よく目にする「人工知能」は、機械学習の仕組みを使って作られています。

学習って?


学習とは、データのパターンや関係性を見つけること

「機械が自動で学習する」というイメージが沸かない方が多いと思います。学習とは、データのパターンや関係性を見つけ、イイ感じの結果を導き出すことです。

たとえば、アパートの家賃の例を考えましょう。ある部屋の広さと、その部屋の家賃をグラフにすると、上の図のようになります。

なんとなく、部屋の面積が大きくなるにつれて、家賃が高くなることが分かります。これは皆さんも感覚的に理解できるでしょう。このような関係性やパターンを導くことを「学習」と呼びます。

機械学習では、必要なデータを機械に渡すだけで、パターンを自動で学習してくれます。人間が行うのは、簡単な設定だけです。アパートの例で考えると、部屋の広さと、家賃を入力するだけで、それらの規則性を学んでくれるということです。

ポイントは、自動で勝手に学んでくれる、という点です。

機械学習と統計学の違い


機械学習と統計学の違い

さて、機械学習と統計学は、どちらもデータを扱う分野です。この 2 つの違いはとても分かりづらいですが、次の様にイメージすると、理解しやすいでしょう。

  • 統計学では、人間が、推定や検定などの統計手法を使って、データの説明をします。
  • 機械学習では、機械が、データの関係性を自動で学習して、予測や分類をします。

これら 2 つについて、詳しく解説していきます。統計学でも機械学習でも、数学的な手法を使うことで、データから問題を解決しようとする点は共通しています。ただ、これらの 2 つは目的が異なっています。

01. 統計学の目的 = データの説明

統計学では、データを「説明」することを目的としています。
たとえば、平均や標準偏差、相関係数などの、統計的な指標を導き、その指標とデータを見比べることで、データの特徴が分かります。データの様子がよりクリアになり、分かることが増えていくイメージです。

これにより、何かの物事に対して、それが良いことなのか、悪いことなのか、よくあることなのか、などを、論理的に説明することができます。このように、統計学では、データの特徴や関係性を説明し、解釈することを、目的としています。

02. 機械学習の目的 = 予測や分類

一方、機械学習では、最適な予測や分類をすることを目的としています。決められた手順に従って、機械がデータの関係性を自動で学習することで、未来を予測したり、アイテムを分類したりします。たとえば、日本の人口減少の要因を推測したり、将来の人口を予測したりできます。

これは、統計学のように、データの様子をより鮮明にすることに軸を置いているのではなく、データから新しい結果を生み出すことに軸を置いています。

このように、機械学習では、データから得られる情報をもとに、精度の高い予測や分類の結果を得ることを目的としています。

たくさんのデータの関係性を導く、ということは、たくさんのデータを、統計的な考え方で計算するということです。機械学習でも、内部では統計的な計算がたくさん行われています。

すなわち、機械学習は、統計学の考え方が土台にあることで、成り立っている分野です。統計の延長線上に、機械学習やディープラーニングがある、という事です。

近年、機械学習の分野では、新しい技術が日々生み出されています。この AI ブームの勢いに乗って、いきなりディープラーニングから学習する方も多いですが、それらの技術の基礎には、統計学があるということを、頭に置いておきましょう。

まとめ

今回は、機械学習の概要と、統計学との関係性を紹介しました。


まとめ

皆さんの理解が一歩でも進んだのなら嬉しいです。

機械学習をもっと詳しく

統計学が分かると、機械学習や DeepLearning の内容がスムーズに入ってきます。

DeepLearning の基礎を本にまとめています。手に取って頂けるととても喜びます ↓

https://zenn.dev/nekoallergy/books/904df952389317


ねこアレルギーのAI

ねこアレルギーの AI
普段は YouTube で機械学習について発信しています。お時間ある方は覗いていただけると喜びます。

https://www.youtube.com/channel/UCbCHn_q5MUAz5ZDNA-wKsug





Created by NekoAllergy

Discussion

ログインするとコメントできます