今週の生成AI情報まとめ(6/24~6/30)
こんにちは、ナウキャストでLLMエンジニアをしているRyotaroです。
社内で情報収集した生成AI関連の技術ネタを週次でまとめて共有しており、せっかくなら社外にも公開していこうという話になったので、ここで公開していこうと思います。
内容としては自分が前の週に収集した生成AI関連のXでの投稿や記事・論文が中心になります。その時に興味があるものをピックアップしているので、多少古いものも含まれています。ただ、なるべき最近のものにフォーカスしていこうと思うので、多めにいていただければと思います。
それでは行きましょう。
6/27 OpenAIがCriticGPTを公開
OpenAIは6/27に、ChatGPTが生成したコードのエラーを検出するための新しいAIモデル「CriticGPT」を発表。ChatGPT以来初のナンバーシリーズではないGPTの発表で、LLMの強化学習に利用される。
CriticGPTは名前の通り,GPTの間違いを指摘するGPTで,RLHF(Reinforcement Learning from Human Feedback)に組み込み,フィードバックの質を上げるのに利用される。RLHFとは、人間のフィードバックを活用して強化学習を行うことで、LLMをより人間の意図や価値観に沿った出力ができるように調整する技術であるため、LLMの性能が上がるにつれて,このフィードバックが難しくなる問題(ほとんどの出力が正確なので,微妙な間違いがほとんどになる)があるが,CriticGPTを使うことで,コードレビューでバグを発見できる確率が人間単体よりも高くなったという結果に。
CriticGPTの主な特徴は以下の通り:
- GPT-4をベースにしており、ChatGPTの出力エラーを発見することに特化
- 人間のAIトレーナーを支援し、RLHF(人間からのフィードバックによる強化学習)プロセスを改善することを目的とする
- ChatGPTが生成したコードのエラーを60%以上の精度で検出可能
- AIトレーナーがCriticGPTを使用することで、より包括的なレビューが可能になり、ハルシネーション(誤ったもっともらしい回答)を減らすことができる
参考:
主要な大規模言語モデル比較表
モデル名APIでのモデル名
|
説明 | 扱えるtoken数 | 学習データ | 費用 (100万tokenあたり) | マルチモーダル対応 | Chatbot Arena Score ('24/05) |
---|---|---|---|---|---|---|
GPT-4ogpt-4o
|
2024年5月時点で世界最高精度を誇るOpenAIの旗艦モデル。画像認識機能も備える。 | 128,000 | 2023年12月まで | 入力: $5 出力: $15 |
画像 | 1309 |
Claude 3.5 Sonnet ( claude-3-sonnet-20240229 ) |
2024年6月時点でのAnthropicの最新モデル。Claudeの中でもっとも高性能なモデルとなっている。 | 200,000 (出力は最大4,096) | 2024年4月まで | 入力: $3 出力: $15 |
画像 | ー |
Gemini 1.5 Progemini-1.5-pro-latest (※1) |
Chatbot Arenaの評価はGPT-4oに敗れているものの、100万トークン以上を扱えるという圧倒的な強みがある。 マルチモーダルにも強く、2024年5月時点で手軽に使えるモデルとしては珍しく動画および音声を処理することができる。 |
1,048,576 (※3) (出力は最大8,192) |
2023年初旬 | 12.8万tokenまで 入力: $3.5 出力: $10.5 12.8万token以上 入力: $7 出力: $21 |
画像 動画 音声 |
1248 |
Gemini 1.5 Flashgemini-1.5-flash-latest (※1) |
ChatGPT 3.5 Turboより安価ながら、廉価版モデルとしては非常に高性能、かつ、長いコンテキストやマルチモーダルを扱えるモデル。 Gemini 1.5 Proと同様に動画や音声も処理可能。 |
1,048,576 (出力は最大8,192) |
2023年初旬 | 12.8万tokenまで 入力: $0.35 出力: $1.05 12.8万token以上 入力: $0.7 出力: $2.1 |
画像 動画 音声 |
ー |
参考:
プロンプトを自動生成できるサイト4選
Quartzite ai
Free Prompt optimizer for Language Models (LLMs)
雑なプロンプトを書いて、ボタンを押すと結構リッチなプロンプトが作られる。100%英語で返ってくるがまあまあいい気がする。
トグルで自動で変数を入れてくれる点も素敵。
上のは無料版で、課金すれば下のようにもっとカスタマイズできる
多分ここでモデルとか色々試せる(APIは別途必要)
価格
- 個人利用:$3.99
- Access all flagship models in one app
- Advanced prompt editor
- Prompt optimizer and other powerful tools
- Cloud Sync across devices
- Community support on Discord
- チーム利用:$59.99
- Everything included in other plans, plus:
- 10 seats/users included
- Share Agents and AI Tools with your team
- Priority customer support
- Integration with internal tools
- Configurable prompt library
Coze
見た目は普通のAI Chatbotだが、GPTsのBuilderのように会話をしながら独自のChatbotを作成でき、その時に生成されるプロンプトが良い(同時に連携されるAPIもよい)
打った文章はこの2文のみ
営業メールを作成してくれるチャットボットを作りたい
メールマスター
# Character
「メールマスター」は、ユーザーが簡単にプロフェッショナルな営業メールを作成できるようサポートするチャットボットです。
## スキル
### スキル1: メールのテンプレートを提供
- ユーザーの業界や目的に応じて適切なメールテンプレートを提案します。
- 提案するテンプレートのフォーマット例:
=====
- 業界: <業界名>
- メールの目的: <営業の目的>
- テンプレート: <メールのテンプレート>
=====
### スキル2: メールの内容を最適化
- ユーザーが入力したメール内容を確認し、プロフェッショナルな表現に修正します。
- 修正されたメール内容を提供します。
### スキル3: メールのマナーとエチケットを教える
- メールの書き方やビジネスマナーに関するアドバイスを提供します。
- 関連する例文や説明を提供します。
## 制約:
- メール作成に関する質問のみ対応します。
- 提供されたフォーマットに従って回答します
Claude
Dify Prompt Generator
Dify専用のプロンプトを生成するジェネレーター
We are Hiring!
この件についてもっと詳しく知りたい、議論したい、はたまたナウキャストという会社に興味を持ったという方は、カジュアル面談フォームから連絡ください。その際に「今週の生成AI情報まとめ見た!」と書いていただければ幸いです!
Discussion