OpenAI o1とGPT-4oとの違い
はじめに
2024年12月5日(現地時間)、「12 Days of OpenAI」のDay1の中で推論能力に優れたLLM「o1」の正式版リリースと、上位モデル「o1 pro mode」リリースのアナウンスがありました。同年9月にリリースされた「o1 preview」より回答速度が速く精度が高い、思考能力が高くTEM(Science, Technology, Engineering, Mathematics)以外の分野でも活用できそうということで、話題になっています。一方で、この「o1」のすごさがわかりづらい所があるので、既存のGPT-4oとの比較もしながら見ていけたらと思います。
o1はすごい?
12月5日以降、OpenAI公式を含めてo1の解説記事や動画が多数配信されています。様々な情報に触れていく中で、o1のすごさをなんとなく理解できるのですが、具体ビジネスにどのようなインパクトをもたらすのか、業務効率化や品質向上にどのように繋がるのかイメージがしづらくもやもやしています。
上記スライドのそれぞれのリンクは下記となります。ぜひご覧ください!
o1とGPT-4oとの違い
o1を理解するためにこれまでのLLM、具体的にはGPT-4oとの違いを見ていきましょう。GPT-4oは利用者が入力する指示に対して、インターネット上にある膨大な知識を使ってそれっぽい回答をしています。一方で、o1は膨大な知識に加えて推論したうえで回答します。この推論ですが、「思考の連鎖」と「自己整合性」等を使っていると言われています。これらの手法はプロンプトエンジニアリングでも使われていて、o1はプロンプトエンジニアリングで使われている推定の手法を最初から取り入れているとも言えます。
o1の位置づけ
もう1つ、o1を理解するためにOpenAIが定義しているAGI(人工汎用知能)に向けた5段階を見ていきましょう。OpenAI曰く、o1以前はLevel2に限りなく近づいているとコメントしていて、o1 previewリリース時にはLevel2に達したとコメントしていました。o1のすごさがわかりづらいものの、少なくともo1の登場によりAGIへ一歩前進した点、Level1からLevel2という新しい段階へステップアップした点、我々は認識すべきなのかなと考えています。ここ1,2年で多くの企業で生成AI活用の検討や実行がなされてきたと思います。うまくいかなかったことも多々あったでしょう。Level1でうまくいかなかったこともLevel2では改善されることも考えられます。一度諦めていた分野やタスクについても再度生成AI活用を検討すべき時なのかもしれません。
o1を使った所感
o1を使った所感は下記スライドのとおりなのですが、中々言語化するのが難しいです。ただ、知的労働の支援にかなり使えそうになったというのと、繰り返しになりますが生成AI活用の再検討をするタイミングになったのかなと言えそうです。
AI活用を再検討してみよう
実際どのように検討していけばよいのでしょうか。がむしゃらで再検討するのではなく、o1の特性を理解したうえで再検討するべきですね。下記スライドの通り一例をあげました。実は下記再検討例は、o1と一緒に考えています。AI活用自体、o1と考えていくのかもしれませんね。
さいごに
いかがでしたか。「o1」のすごさがわかりづらい所があるので、既存のGPT-4oとの比較もしながら見ていきました。この記事を読んでくださる方の日々の業務や生活の何かのヒントになれば幸いです。
Discussion