AI基礎1【機械学習・深層学習】
この記事でわかること
この記事では、以下のことが理解できます:
- AIの基本概念から最新のLLMまで、体系的に学べる実践的な知識
- 機械学習、深層学習の基礎と実装方法
- LLM(大規模言語モデル)を活用したアプリケーション開発の具体的な方法
目次
AIとは?
AIの定義は明確ではありませんが、IBM(1911年に創業。コンピュータ・ハードウェアからソフトウェアまで、ITサービスを提供する世界最大級のテクノロジー企業)によるAIの説明は以下のとおりです。
人工知能(AI)は、コンピューターや機械が人間の知能と問題解決能力をシミュレートできるようにするテクノロジーです。
AIの実現を支えるソフトウェア技術は機械学習・深層学習です。
この技術をもとに自然言語処理(NLP)や画像認識などが行われます。
AIは私たちの生活の様々な場面で活用されています。単独で使われるだけでなく、センサーやGPS、ロボットなどと組み合わせることで、これまで人間にしかできなかった作業を実行できます。
身近な例を挙げると:
- スマートフォンの音声アシスタント
- カーナビのルート案内
- 自動運転車
- ChatGPTのような文章作成AI
これらは、私たちの暮らしの中で使われているAIのごく一部です。今後さらに多くの場面でAIが活用されていくでしょう。
機械学習の基礎
機械学習(Machine Learning)とは、「コンピュータが大量のデータから自動的にパターンや規則を学び取り、それを使って新しいデータに対して予測や判断を行う仕組み」のことを指します。
機械学習のイメージ
たとえば、人間の場合は部活でスポーツを練習すれば、少しずつ上達していきますよね。試合での経験を通じて「次はこういう場面ではこう動こう」と学ぶわけです。機械学習でも似たようなことをします。
- 大量のサンプルデータ(例:スポーツでいえば練習試合の記録)
- それに対する結果や評価(失点につながった動き、成功につながった動き)
これらの情報をコンピュータに与えて、コンピュータ自身が「どういう時にどう行動すると良いのか」を自動的に学習していきます。
機械学習の主な種類
機械学習は、目的やデータの性質によっていくつかの種類に分けられます。代表的なのは以下の3つです。
- 教師あり学習(Supervised Learning)
学習に使うデータ(入力)と、その正解(ラベル)がセットになっている。
具体的には、入力データと正解データから学習し、未知の入力に対して正解を予測する。 - 教師なし学習(Unsupervised Learning)
正解(ラベル)がないデータを使って、データの中にあるパターンや構造を見つけ出す。
「データをどのように分類したら良いか」を人間が決めずに、コンピュータが自分で共通点を見つける。 - 強化学習(Reinforcement Learning)
エージェント(学習者)が、環境とのやりとりを通じて「報酬」を獲得するように行動を学ぶ手法。
「いまの行動は良かったのか?悪かったのか?」というフィードバックを得ながら、より高い報酬を得られるように行動を最適化していく。
深層学習の基礎
深層学習(Deep Learning)とは、「ディープニューラルネットワーク(多層ニューラルネットワーク)」を用いた機械学習の手法の総称です。
- ニューラルネットワーク とは、人間の脳の神経細胞(ニューロン)の働きをまねして情報を処理する仕組みです。
- 従来のニューラルネットワークは層(レイヤー)の数が少なかったのに対し、深層学習では多数の層を重ねる(深くする)ことで、より複雑で高度な問題を扱えるようにしたのが特徴です。
深層学習が得意なこと
-
画像認識
写真や動画の中に写っている物体を検出し、「これは犬」「これは猫」といった分類を高精度で行えます。自動運転や防犯カメラの分析、医療画像診断など、さまざまな場面で応用されています。 -
音声認識
スマートフォンの音声アシスタント(Siri、Googleアシスタントなど)や、スピーカー(Alexaなど)の裏側にある音声認識は、深層学習を用いて大きく精度が上がりました。話し言葉をテキストに変換し、それに応じて応答を返す技術が広く実用化されています。 -
自然言語処理
チャットボットや翻訳システムなど、人間の言葉(自然言語)を理解・生成する技術も深層学習が支えています。最近注目されている大規模言語モデル(LLM)も、深層学習に基づく手法の一つです。 -
時系列予測
株価や気温、需要予測など、時間の経過とともに変化するデータを扱うタスクでも深層学習が使われます。長い期間のデータを取り込んで、その傾向を捉えることが可能になりました。
深層学習の流れ
深層学習の大まかな流れを簡潔に説明します。
- データの準備
学習させたいデータを集める(例:画像、テキスト、音声など)。
データを数値化し、ネットワークに入力できる形式に整える。 - ニューラルネットワークの設計
「入力層」「隠れ層(複数)」「出力層」を持つネットワークを構築する。
隠れ層の数やニューロンの数を設定。 - 学習(トレーニング)
データを入力して予測を行い、「正解」とのズレ(誤差)を計算。
誤差逆伝播法(バックプロパゲーション)を使って、ネットワークの重みを調整。
このプロセスを繰り返し、誤差が小さくなるように学習を進める。 - 評価
学習に使っていないテストデータを入力し、予測の正確さを確認。
必要に応じてネットワークの構造や学習のパラメータを調整。 - 実際の運用(推論)
学習済みモデルを使って、新しいデータに対して予測や判断を行う。
詳細は以下の記事がおすすめです!
いったんまとめ
- AI(人工知能):人間のように考え、学び、判断する仕組みの総称(例:顔認識や自動運転)。
- 機械学習:AIの一部で、データを使ってコンピュータがルールを自動で学ぶ技術(例:スパムメール分類)。
- 深層学習:機械学習の一部で、多層構造のニューラルネットワークを使って高度な学習を行う手法(例:画像認識やChatGPT)。
- 違い:AIは広い概念、機械学習はデータから学ぶ技術、深層学習はさらに高度な学習技術。
これらは連携しながら様々な分野で応用されています。
次にいよいよLLM(大規模言語モデル)を以下の記事で解説していきます!
担当:生駒
Discussion