AI・機械学習・ニューラルネットワーク・ディープラーニングとは?

に公開

この記事で学べること

みなさん、こんにちは。りゅう9です。この記事では、AIについて勉強しようと思うと必ず目にする図をもとにAI・機械学習・ニューラルネットワーク・ディープラーニングとは何かをまとめます。難しい数式を使った説明は省略して概念を説明する記事とします。
初めてのZenn記事です。練習を兼ねて。。。

AI・機械学習・ニューラルネットワーク・ディープラーニングの関係性

AIとは

AIについて学習したことがある方は、皆さん一度はこのような概念図を一度は目にしたことがあると思います。この図の意味するところは、AIという概念の中に機械学習があり、さらに機械学習の中にニューラルネットワークがあり、さらにその中にディープラーニングがあるということです。それぞれその詳細を記していきます。

AI (人工知能) とは

AI (Artificial Intelligence, 人工知能) は、人間の知的な働きをコンピュータで模倣しようとする技術と解釈されることが多いです。ここで、「多いです」と書いた理由は、学者によってAIの定義がバラバラであるからです。
AIの研究は1950年代から始まっており、この中で3回のブームがあったと言われています。

  • 第1次ブーム (1950年代から1960年代)
    第1次ブームでは探索推論がキーワードとなっています。探索とは問題の解を選択肢の中から見つけ出すこと、推論は既知の情報を使って結論を導き出すことです。迷路を解くようなシステムや、ELIZAというチャットボットのようなシステムが生まれました。
    これらのシステムはあるルールにもとづくものでした。現実世界の複雑な環境をルール化するのは難しく、また、コンピュータの計算性能も低く第1次ブームは終焉を迎えました。
  • 第2次ブーム (1980年代から1990年代)
    第2次ブームではエキスパートシステムがキーワードとなっています。エキスパートシステムとは、専門家の知識をルール化し、特定の分野で人間のように判断するシステムです。医療診断システムや工場の故障診断システムが成果として挙げられます。
    しかし、この知識は人間が手作業で入力する必要があり多大な労力がかかったことや、例外的な事象への対応が難しかったことから、期待がしぼんでいき第2次ブームも終焉を迎えました。
  • 第3次ブーム (2010年代から)
    第3次ブームは現在まで続くブームです。特にディープラーニングが大きな要因でしょう。これにより画像認識や音声認識、自然言語処理 (翻訳や対話型AI) が成果に挙げられ、現在でも進化が続いています。また、インターネットが普及し、ビッグデータを活用できるようになったことやGPUによる高速計算が可能になったこともこのブームを加速させています。
    ※ 生成AIが急速に発展している現在を第4次ブームとみるような考え方もあるようです。

ここまで、AIの誕生から現在に至るまでの進化の過程をみてきました。さらに、AIは強いAI弱いAIに分けられます。

  • 強いAI (汎用AI)
    強いAIとは、人間のように多様な知能や判断ができるAIのことを指します。理解・推論・計画・創造など幅広い知的作業をこなすことができるAIでSFの世界で活躍しているようなAIで、まだ実現されていません。
  • 弱いAI (特化型AI)
    弱いAIとは、特定のタスクに特化したAIです。例えば、画像認識や音声認識、レコメンドシステムなどです。現在世の中で活躍しているAIと言われるものはすべてこちらと言っていいでしょう。

AIの概要はこれくらいかなと思います。次に、機械学習についてみていきます。

機械学習とは

機械学習 (Machine Learning, ML) とは、大量のデータをコンピュータに渡して、コンピュータ自身にルールやパターンを見つけてもらう技術です。第1次AIブームの時には、人間がルールを与えていましたが、機械学習では人間がすべてのルールを書かなくても、コンピュータが入力されたデータからルールを学習してくれます。機械学習の種類は以下の3つに大別されます。

  • 教師あり学習
    教師あり学習は、データに正解を付けてコンピュータに学習させるものです。この「正解」は人間が付けます。教師あり学習には回帰分類が存在します。
    • 回帰
      回帰とは入力データから数値を予測する問題です。コンビニの売り上げ予測を例に考えましょう。過去1年間の曜日や天気、周辺のイベント情報といった特徴量 (データ) とその日の売り上げ金額といったラベル (正解) を学習用のデータとして、学習させます。その後、明日の曜日や天気、イベントの有無を入力することで売上金額を予測してくれます。これにより、仕入れ量やバイトのシフトを決めるのに役立ちます。
    • 分類
      分類とは入力データをクラス (カテゴリ) に分ける問題です。「犬」と「猫」の画像認識を例に考えましょう。犬が写った画像と猫が写った画像 (データ) を大量に用意し、その画像に「犬」が写っているのか、「猫」が写っているのかのラベル (正解) を付けて学習させます。その後、新たに撮ってきた犬が写った画像を入力すると、その画像に映っているのは「犬」だと自動で判別してくれます。
  • 教師なし学習
    教師なし学習は、教師あり学習とは異なり、正解ラベルを付けることなく、コンピュータが勝手にデータのパターンを見つけるものです。代表的な手法にクラスタリング次元削減があります。
    • クラスタリング
      クラスタリングとは、データを似ているモノ同士のグループに分けることです。このグループのことをクラスタと言います。
    • 次元削減
      次元削減とは、多くの特徴量を持ったデータを少数の重要な要素にまとめることです。具体的な次元削減の手法に主成分分析 (PCA) というものがあります。例えば、10問の質問があるアンケート (10次元のデータ) を1000人に実施したときを考えます。10次元もあるのは見にくいので、もっと次元を減らしたくなります。例えば、設問2をAと答える人は、設問3と4もAと答えがちだという特徴を見つけたら、この設問2, 3, 4を一つの新たな特徴量に変えます。そうすると、8次元に削減できました。実際は2次元や3次元まで削減して図でぱっと見で分かるようにすることも多いです。
  • 強化学習
    強化学習は、「行動」を試しながら、良い結果を増やすために自分で学ぶ方法です。例えば、囲碁を戦うようなシステムです。囲碁を戦って勝ったら報酬がもらえて、負けたら罰が与えられるようにします。報酬が欲しいので、だんだんと賢くなっていくようなイメージです。

機械学習についてはさらに詳しい記事を出したいと思います。

ニューラルネットワークとは

ニューラルネットワーク (Neural Network, NN) とは機械学習で使われる学習アルゴリズムの1つで、人間の脳の神経細胞(ニューロン)の働きをまねて作られたコンピュータの仕組みです。「入力層」、「隠れ層」、「出力層」という3つの層で構成され、これらが結びついています。隠れ層は何層にも重ねられます。各層にはノードがたくさんあり、ノードでは入力に対して、計算をしてその結果を次の層に渡します。ノードは重みというパラメータを持っており、これを自動で調整しながら正解を目指していきます。ニューラルネットワークは学習を行うための強力なモデルの一つです。

ディープラーニングとは

ディープラーニング (Deep Learning, DL, 深層学習) とは、従来のニューラルネットワークよりも非常に多くの隠れ層を持ったものです。

まとめ

AI・機械学習・ニューラルネットワーク・ディープラーニングについてその概要をみてきました。AIの一部に機械学習があり、機械学習の一部にニューラルネットワークがあり、ニューラルネットワークの一部にディープラーニングが存在していることがわかったでしょうか?
誤りなどあればご指摘ください。
これからクラスタリングの様々な手法やディープラーニングについて、そのほかのアルゴリズムについて記事を書いていこうと思います。ぜひご覧下さい。

GitHubで編集を提案

Discussion