Open4

自分用GPT-4oまとめ

Shuichi TsutsumiShuichi Tsutsumi

実は性能は劣化している説

https://twitter.com/ItakGol/status/1790198531417940154

推論、コーディング、数学などに関する980の超難解なサンプルのデータセットでテストしてみた。そして、GPT-4よりはるかに少ないヒット数だった。
GPT-4は約800で正解し、GPT-4oは約640で正解した。これは20%の劣化だ。

https://twitter.com/masahirochaen/status/1790325483462369308

今回の26分ほどのGPT-4oの初回動画を読み込ませて要約を依頼したところ、GPT-4oでは上手く要約ができなかった。
Gemini 1.5 Proだとほぼ完璧に動画解析ができた。
やはりマルチモーダルはまだGeminiが強い。

https://twitter.com/satori_sz9/status/1790378672098017580

・プログラム … 元木さん曰く微妙
・動画の解説 … チャエンさん曰く微妙(Geminiの方が良い)
・リサーチ … 私や色々な人の意見をまとめると微妙。Perplexityの方が良い

https://twitter.com/odashi_t/status/1790264883185131758

PerplexityからGPT-4o使うと調査タスクも良い感じ、という話も。
https://x.com/satori_sz9/status/1790313943619310056

Shuichi TsutsumiShuichi Tsutsumi

こういうこともできる/便利そうな使い方メモ

サウンド生成

  • 人間の音声だけじゃなく、その他のサウンドの生成も可能

https://twitter.com/itsandrewgao/status/1790080471612727655

3Dモデル生成

https://twitter.com/H0meMadeGarbage/status/1790280301379473713

動画理解

  • 動画見てもらってツイート文言考えてもらう
    • YouTubeの動画リンクを渡す

https://twitter.com/H0meMadeGarbage/status/1790378687314919549

画像理解

  • スクショ撮って質問
    • キーバインドでmacOSアプリを呼び出し → スクショ撮影して「この回路図について説明して」

https://twitter.com/GOROman/status/1790529103512453438

  • マンガ作品のレビュー
    • ストーリー解説、面白いポイント解説、改善点の提示

https://twitter.com/nukosama/status/1790306219678478366

画像生成

  • 複数画像の合成

https://twitter.com/SuguruKun_ai/status/1790114169204715931

Shuichi TsutsumiShuichi Tsutsumi

影響

これだけ音声や動画でのレスポンスが早くなったので、アプリケーションレイヤーでは、これまで現実的にChat(文字)でしかやり取り出来なかったことが、音声でもできるようになるので、いろいろ出来ることが増える

電話(アウトバウンド、インバウンド)をAIで置き換えるというスタートアップが爆増する

GPUチップレイヤーでは、学習用のチップ(性能重視)と実行用のチップ(レスポンススピード重視)が分かれて進化していく

https://twitter.com/shibataism/status/1790243310516515085