🤖

RailsからOpenAI APIなどを呼んでストリーミングレスポンスを少しずつ処理する方法（HTTParty）

maaaaakoto35

2025/10/27に公開

近頃寒くなってきており、非常に過ごし易い季節になりましたね。
さて今回はHTTPartyというgemを使った際にstreamingで受け取ったレスポンスを少しずつ処理する方法についてシェアしたいと思います！
https://github.com/jnunemaker/httparty

 やりたいことやりたいことは以下です。
Railsで動いているサーバーからOpenAIなどの生成AIを呼びたい
レスポンスに時間がかかることが考えられるため、少しずつRailsサーバーからレスポンスを返したい
リクエストはHTTPartyで送りたい
OpenAIなどの生成AIはstreamingでレスポンスを返す仕組みがあります。
https://platform.openai.com/docs/guides/streaming-responses?api-mode=responses
これらのAPIからのレスポンスを少しずつ処理したいときってありますよね。

 方法以下みたいな形で stream_body というオプションを渡しつつ、streamingで受け取ったデータをblockで処理します。
chunked_body = ''
HTTParty.post(
  '叩きたいAPIのエンドポイント',
  {
    headers:          headers,
    body:             body.to_json,
    stream_body:      true,
    timeout:          30,
    read_timeout:     60, # ストリーミングデータ読み取り中の無応答タイムアウト（秒）
  },
) do |response_fragment|
  chunked_body += response_fragment

  while (index = chunked_body.index("\n"))
    line = chunked_body[0..index]
    chunked_body = chunked_body[(index + 1)..] || ''

    # 何らかの処理
  end
end
OpenAIのStreaming APIは、Server-Sent Events (SSE) 形式でレスポンスを返します。

各イベントは data: {json}\n という形式で、改行で区切られています。
https://developer.mozilla.org/ja/docs/Web/API/Server-sent_events/Using_server-sent_events#サーバーからのイベントの送信
ここでの何らかの処理とはDBへの書き込みやRedisのPub/Subを使っている際のpublishなどが挙げられます。
ここで気になるのはblockで渡されるオブジェクトがどんなオブジェクトか、ですよね。

ではライブラリでも見ましょう。

 コードリーディングHTTParty.post を呼ぶと最終的に以下の関数が実行されます。
https://github.com/jnunemaker/httparty/blob/5c8b45e6297d181d99a56f5297dade3e358cc6f9/lib/httparty/request.rb#L150-L169
blockが渡されている場合はL164で ResponseFragment というクラスのインスタンスが渡されていますね。

なので、先ほどの response_fragment は HTTParty::ResponseFragment というクラスのオブジェクトだということが分かりました。
https://github.com/jnunemaker/httparty/blob/5c8b45e6297d181d99a56f5297dade3e358cc6f9/lib/httparty/response_fragment.rb#L7-L20
ResponseFragment は SimpleDelegator を継承しているらしいですね。
https://docs.ruby-lang.org/ja/latest/class/SimpleDelegator.html
L18で super fragment をしているため、perform関数で渡していた encoded_fragment がsuperされていそうです。
https://github.com/jnunemaker/httparty/blob/5c8b45e6297d181d99a56f5297dade3e358cc6f9/lib/httparty/request.rb#L429-L435
https://github.com/jnunemaker/httparty/blob/5c8b45e6297d181d99a56f5297dade3e358cc6f9/lib/httparty/text_encoder.rb#L13-L19
encoded_fragment はStringだということが分かりました。

なので例のコードの response_fragment はStringに以下の関数(attributes)が生えているオブジェクトっぽいですね。
code
http_response
connection

 まとめ以下のような処理になっています！
HTTPartyではなく、FaradayやHTTP.rbで少しずつレスポンスを処理する記事は他にもあったので、今回はHTTPartyについて書いてみました。
blockで渡されるオブジェクトがStringを拡張したもので、なかなか厄介でしたが他のライブラリも同じような実装なのか気になって、夜はよく眠れます。
それでは！

SMARTCAMP Engineer BlogPublication

SMARTCAMPに所属するエンジニアの個人記事を集めています。記事の内容は個人の見解であり、社内でのレビュー等は行っておりません。

やりたいこと

方法

コードリーディング

まとめ

Discussion