【1分でわかる】機械学習 入門シリーズ
【1分でわかる】機械学習 入門シリーズ
YouTubeで機械学習についてのショート動画を公開しています
このスクラップでは、動画の内容を紹介していきます。
感想やご指摘などありましたら、YouTubeコメント欄まで連絡ください。
随時アップデート予定です!
チャンネル登録よろしくお願いします!
YouTubeのvideoIDが不正です
機械学習って?
機械学習とは、なんらかの問題を解くために、機械が自動で学習してくれる手法のことです。
ここでの「問題を解く」とは、未来を予測したり、アイテムを分類したりすることを指します。
また、「機械」とは、皆さんが使っているパソコンやスマホのようなコンピュータのことを指します。
つまり簡単に言うと、「パソコンにめっちゃ計算させることで、予測したり分類したりしよう!」ってのが機械学習です。
たとえば、コンビニの翌日の売上を予測したり、画像に写っているものを判別したりする問題は、機械学習を使って解くことができます。
最近よく目にする人工知能は、この機械学習を使って作られています。
YouTubeのvideoIDが不正です
学習って?
「機械が自動で学習する」というイメージが沸かない方が多いと思います。
学習とは、パターンや関係性を見つけ、イイ感じの結果を導き出すことです。
たとえば、アパートの家賃の例を考えましょう。
ある部屋の広さと、その部屋の家賃をグラフにすると、このようになります。
なんとなく、部屋の面積が大きくなるにつれて、家賃が高くなることが分かります。
これは皆さんも感覚的に理解できるでしょう。
このような関係性やパターンを導くことを「学習」と呼びます。
機械学習では、必要なデータを機械に渡して、人間が簡単な設定をするだけで、パターンを自動で学習してくれます。
アパートの例で考えると、部屋の広さとその家賃を入力するだけで、規則性を学んでくれるということです。
人間がやらなくてはいけない処理を、かなり少なくすることができるので、とても便利です。
ポイントは、自動で勝手に学んでくれるという点です。
YouTubeのvideoIDが不正です
モデルって?
機械学習のイメージを固めるために、もう少しだけ詳しい内容を解説します。
機械学習では、コンピュータにデータを入力するだけで、データのパターンを自動で学習してくれます。
このとき最終的には、モデルというものが作られて終わります。
モデルとは、データを入力すると、それに対応した、イイ感じの結果を出力してくれる、箱のことです。
機械学習のゴールは、賢いモデルを完成させることです。
学習前のモデルは、データを入力しても、デタラメな結果しか返してくれません。
学習済みのモデルは、データに基づいて、最適な結果を返してくれます。
データを変えたり、学習の方法を工夫したりすることで、精度の良いモデルを作りましょう。
YouTubeのvideoIDが不正です
学習前モデルと学習済モデル
機械学習のモデルには、学習前モデルと、学習済モデルという、2つの状態が存在します。
学習前のモデルは、データを入力しても、デタラメな結果しか返してくれません。
何も学習していないので当然です。
皆さんが先生から何かを教わる時と同じように、学習をする事で、モデルは徐々に賢くなっていきます。
学習が終わると、学習済モデルが完成します。
これがいわゆる、人工知能(AI)と呼ばれる箱になります。
この学習済みモデルに、何かのデータを入力すると、学習したパターンを元に計算が行われ、最適な結果を返してくれます。
一度学習済みモデルを作ってしまえば、何度でも使いまわすことができます。
YouTubeのvideoIDが不正です
アルゴリズムって?
アルゴリズムとは、コンピュータが学習する時のルール、計算手順のことです。
アルゴリズムが違うと、どのように学習するかが変わるため、モデルの精度も大きく変わってきます。
アルゴリズムは、人工知能の精度に直結するので、とても重要です。
機械学習には、たくさんのアルゴリズムがあります。
たとえば、「ランダムフォレスト」や「サポートベクトルマシン」や「ロジスティック回帰」などのアルゴリズムが有名です。
どのアルゴリズムを使っても、機械が勝手に学習してくれるという点は変わりません。
それぞれのアルゴリズムで、得意な問題や苦手な問題があるので、用途によって使い分けるのが一般的です。
YouTubeのvideoIDが不正です
ニューラルネットワークとは?
コンピュータに学習をさせることで、何かを自動で分類したり、判別させようとする研究は、古くから行われてきました。しかし、実際に工場の生産ラインに使用したり、生活に役立ったりするようなレベルまで、精度を高くすることは難しい状況でした。
そんな中、近年、かなりの高精度を出した新しいアルゴリズムが公表されました。そのアルゴリズムが、ニューラルネットワークです。
ニューラルネットワークとは、人間の脳の構造をベースとしている、機械学習アルゴリズムです。古くからあるアルゴリズムと比べて、飛び抜けて高い精度を出したので、機械学習の分野が再注目されるようになりました。
YouTubeのvideoIDが不正です
ニューラルネットワークの凄さ
ニューラルネットワークは、今までの機械学習アルゴリズムと比べて、少し異なる考え方をしています。
従来のアルゴリズムは、特徴量を人間が用意する必要がありました。
機械に注目してほしい、重要なポイントを、人間が決めなきゃいけない、という意味です。
一方でニューラルネットワークは、データから全て自動で学習してくれます。
データのどこに注目するべきかというポイントも含めて、機械が自分で学習して、結果を出力してくれます。
人間の仕事は、データを用意するだけで済みます。
これが、今までとは異なるめっちゃすごい方法であり、ニューラルネットワークの最大の特徴です。
YouTubeのvideoIDが不正です
ディープラーニングとは?
ディープラーニングとは、深層ニューラルネットワークを使った学習方法のことです。
ニューラルネットワークは層構造になっています。
入力層に入れたデータを、中間層でいろいろ計算することによって、出力層に結果が出てきます。
このとき、中間層の数を増やすと、深層ニューラルネットワークと呼ばれるようになります。
そして、この深層ニューラルネットワークを使って学習することを、ディープラーニング、深層学習といいます。
ディープラーニングによって、これまでは難しかった複雑な分類問題や、実用的な予測問題を、高い精度で解けるようになりました。
2012年、この学習方法が発表されたことにより、コンピュータにできることが格段に増え、現在のAIブームが起こりました。
YouTubeのvideoIDが不正です
モデルと特徴量
モデルとは、入力データをもとに、良い感じの予測結果を返してくれる箱のことです。
たとえば、猫の画像を入力すると、「これは猫が写っています」といった結果を返してくれます。
しかし、ほとんどの場合、そのままのデータを入力しても、良い感じの結果を出してはくれません。
人間が試行錯誤しながらデータを加工し、特徴量と呼ばれるデータを作り、それを入力します。
猫っぽい特徴を人間が抽出して、わかりやすいデータに変換してから、入力するということです。
これを特徴量エンジニアリングと呼び、データや解決したい問題に関する深い知識が必要です。
適切な特徴量を見つけるということも、古くからずっと行われてきた研究の1つです。
YouTubeのvideoIDが不正です
ルールベースと機械学習の違い
今、世界中で注目されている人工知能は、ルールベースや機械学習、深層学習などを使って作ることができます。
ルールベースとは、特徴量をもとに、想定される全てのパターンを予めプログラムしておくやり方です。ルールベースの場合は、特徴量もモデルの詳細も、人間が決める必要があります。
一方、機械学習の場合、特徴量からパターンを自動で学習して、パラメータの値を決定することができます。ルールベースとは異なり、人間がすべきなのは、適切な特徴量を用意することだけです。
さらに深層学習の場合は、データから、特徴量とモデルのパラメータ、全てを学習してくれます。これはめっちゃ凄いことであり、深層学習、ディープラーニングが注目を集めている理由です。
今は人工知能といえば、ディープラーニングのことを指します。
YouTubeのvideoIDが不正です