📰

OpenAI o1に関するメモ

2024/09/28に公開

はじめに

OpenAI o1、そこまで注目していなかったのですが、じわじわと「すごいのでは?」という気になってきたので、雑に関係する情報や気になる記事をまとめてみました。

o1の仕組みは、アプローチ的には人間は簡単な問題には反射的に答える(答えられる)けど、難しい問題はじっくり考えるから、AIにも同じようにじっくり考えさせてみよう(推論時間のスケーリングとかよばれたりします)という発想だと思います(おそらく、違ったらすみません)。

LLMは、基本的に解くべき問題の難易度で出力のスピードは変わらない(一定の量の計算をすると確率が出力される)ので、自分は今まで「じっくり考えられない点がAIと人間の違いだなー」と思ってましたが、あっさりとLLMもじっくり考えられれるようになってしまいましたね。

o1は評価が割れていますが、頭がよすぎても、それを使う人が理解できない、能力を使いこなせない、そもそも使いどころがないってことがあるのかなと思います。大体の人って、普段そんな高度なことを考えたりやったりしているわけじゃないですもんね。

関係する情報

以下雑にまとめたものです。ただのリンク集です。

試行

自分がo1にコーディングさせてみた例です。GPT-4oでもできてしまうので、差が分かりづらいですね。高度な題を考えるのが難しい。

https://x.com/karaage0703/status/1835625077783835020

o1
https://karaage0703.github.io/daily-creative-coding/20240916_001_tornado/

GPT-4o
https://karaage0703.github.io/daily-creative-coding/20240916_002_tornado/

公式

https://platform.openai.com/docs/guides/reasoning/quickstart

関係ブログ

https://note.com/npaka/n/nb8f7c4fe696d

https://note.com/npaka/n/n74ad587fee22

https://qiita.com/kennichi3988/items/1de023406a1a6de35575

https://qiita.com/Tadataka_Takahashi/items/9ce954cad743d411e125

https://qiita.com/SolingJiner/items/9dd7193d78e2c406a4d2

https://qiita.com/SolingJiner/items/46cf80eccc5be2b9285e

https://qiita.com/youtoy/items/0b786a929c5affdeb69c

https://speakerdeck.com/minorun365/tuinichu-ta-openainozui-xin-moderu-o1-tutehe-gasugoino

https://note.com/hatti8/n/n867c36ffda45

https://github.com/hijkzzz/Awesome-LLM-Strawberry

https://zenn.dev/sterashima78/articles/2b6fafc86415b6

https://podcasters.spotify.com/pod/show/data-analytics/episodes/82--OpenAI-o1ChatGPTAI-e2ore01

https://qiita.com/Tadataka_Takahashi/items/9ce954cad743d411e125

https://x.com/K_Ishi_AI/status/1836590806251245998

https://qiita.com/kennichi3988/items/1de023406a1a6de35575

動画

松田語録:OpenAI o1-previewの強いところ・弱いところ

塚本レポ:OpenAI o1の論理的思考を試してみた

塚本レポ:o1-previewの論理数学知能をmake 10 パズルで試す

まとめ

Open AIのo1でLLMは人間みたいに"じっくり考える"ことができるようになったわけですが、次は何でしょうね。お風呂に入っているときのヒラメキ(エウレカ)を再現できたら面白そうですね。これを実現するには、身体性が必要なのかな?無くても再現できる方法あるのかなとかそんなことを考えてしまいます。

関連記事

https://zenn.dev/karaage0703/articles/9cd710b4f96057

Discussion