😊

OpenAI Realtime API を試してみた

2024/10/02に公開

OpenAIが発表したRealtime APIが気になっていたので,早速試してみました.

公式ドキュメントではopenai-realtime-console というデモアプリケーションを試すことが推奨されていたので,そちらを利用することにしました.

デモアプリのセットアップ

まずはリポジトリをクローンし,必要なパッケージをインストールします.

git clone https://github.com/openai/openai-realtime-console.git
cd openai-realtime-console
npm i

インストール中にいくつか警告が出ましたが,ひとまず無視して先に進みます.

次に,アプリを起動します.

npm start

これで http://localhost:3000 にアクセスすればデモアプリが使えるはずです.

APIキーの入力と接続エラー

ブラウザで http://localhost:3000 を開くと,OpenAI API Keyの入力を求められました.

APIキー入力画面

APIキーを入力すると,デモアプリの画面が表示されました.

デモアプリ画面

期待に胸を膨らませながら "connect" ボタンを押したのですが…エラーが発生して接続できませんでした.

接続エラー

Tierによる制限を疑いましたが,公式アナウンスによると,Tier5で約100の同時セッション,Tier1-4 はそれ以下の制限とのこと.Tier5のアカウントなので制限に引っかかることはなさそうです.

原因はロールアウトの遅延

その後,GitHubのIssueで同様のエラー報告を発見しました.

Realtime APIはまだ完全にロールアウトされておらず,今週中に完了する予定とのこと.
待ちましょう😭

以下2024/10/07追記

使えるようになった

使えるようになりました😊
https://x.com/__be4rr/status/1843253234317811833

ただ音声での会話は料金が非常に高いので,利用時には注意が必要です.

Audio*
$100.00 / 1M input tokens
$200.00 / 1M output tokens

Pricing | OpenAI

Discussion