🙂

OpenAI開発者向けUpdate - OpenAI DevDay開催、構造化出力、GTP-4oスピードUpとコストDown

2024/08/12に公開

はじめに

2024年8月9日早朝(日本時間)にOpenAIから開発者向けUpdateのメールが来ました。内容を追っていきましょう!

1. OpenAI DevDay の開催

サンフランシスコ、ロンドン、シンガポールでOpenAI DevDayが開催されるそうです。モデルのカスタマイズからマルチモーダルアプリケーションまで、実践的なセッション、デモ、ワークショップが行われるようです。OpenAIのエンジニアと交流し、世界中の開発者がOpenAIを使ってどのように構築しているかを聞くことができるそうで、個人的にはめちゃくちゃ行きたい!

2. 構造化出力によるJSONスキーマ準拠の出力生成

モデルが生成する出力が、指定されたJSONスキーマと完全に一致することを保証する機能がリリースされました。詳細は下記URLのドキュメントに記載されていますが、APIのResponseを固定したスキーマで返してくれるようになる機能となります。これまで生成AIの特性でもありますが、回答の形式が安定しなくてプロンプトを工夫したり、それでもうまく安定せずに生成AIの回答を受け取るアプリで実装を工夫することが必要でした。この改善は生成AIアプリの開発者にとってはかなり朗報と言えますね!
https://openai.com/index/introducing-structured-outputs-in-the-api/
具体的には、API呼び出し時に「strict:ture」にするのと、

Responseのスキーマを明示的に指定するで実現できます。

最新の GPT-4o モデルである gpt-4o-2024-08-06 と gpt-4o-mini-2024-07-18 で動作して、これらのモデルをベースとしたファインチューニングモデルにも適用されるとのこと!

3. GPT-4oの最新スナップショットによるコスト削減

最新のGPT-4oスナップショット gpt-4o-2024-08-06 は、元のGPT-4oと比較して、入力トークンが50%、出力トークンが33%安価になりました。また、#2で紹介している構造化出力もサポートしています。下記サイトによるとスピードも上がっているようですね。

https://artificialanalysis.ai/

4. GPT-4o mini のAPIアクセスと9月23日までの無料ファインチューニング

これまで限られたユーザしか利用できなかったGEP-4o miniのファインチューニングに、すべての有料顧客が利用可能になったそうです。また、2024年9月23日まではファインチューニング無料とのこと。(1日あたり最大200万のトレーニングトークン)
現状、LLMが苦手な業務独自情報はRAGというのが一般的な手法ですが、ファインチューニングも活用できる手法の1つになります。この機会に試していきたいところですね。
RAGとファインチューニングの違いは下記記事をぜひ参考にしてください!

プロンプト、RAG、ファインチューニングの違いを学ぶ No.1
https://zenn.dev/acntechjp/articles/75040fe187f425
プロンプト、RAG、ファインチューニングの違いを学ぶ No.2
https://zenn.dev/acntechjp/articles/316d969547b3f1

5. その他のアップデート

テキスト読み上げ機能がPlaygroundで利用可能になりました。
関数呼び出しがPlaygroundで使用できるようになりました。
管理APIと監査ログAPIを使用して、API組織を管理できるようになりました。
Microsoftと共同で、OpenAI .NET SDK(現在ベータ版)をリリースしました。

さいごに

OpenAIも日々進化しており、2024年秋開催のDev Dayは非常に楽しみですね。これまで新しいLLMの話しが多かった印象ですが、今回のイベントは「どう生成AIを活用するか?」にフォーカスしている印象です。この2年弱ほどで生成AIの技術が一気に進化して注目を集めていますが、今後はより具体的な活用にフォーカスがあたってくるのはと考えます。

Accenture Japan (有志)

Discussion