📘

Claude Code 探訪: LLM と共に働く中で見えてきた『与ストレス度』という仮指標

に公開


はじめに

前回、約3ヶ月前の2025/09/11 に Opus 4 と Sonnet 4 を比較した記事 を掲載しました。
その後、わずか3ヶ月の間に Sonnet 4.5 と Opus 4.5 が矢継ぎ早にリリースされ世間を賑わせています。

本記事ではそんな Sonnet 4.5、Opus 4.5 を業務で活用する中で気がついた、
LLM と働く際に避けがたい問題である LLM が人間に与える「ストレス」 に着目し、
その要因と対策について考えていきます。


前回の記事の3行まとめ

  • Sonnet 4 と Opus 4 を比較した時、Sonnet 4 にはゴールに直行したがる癖がある
  • そのため人間なら許さない選択をとりがち = エンジニア倫理が乏しく見える
  • このため、Sonnet の方が人間がストレスを感じるのではないか

この記事の5行まとめ

この記事を5行でまとめると...

  • 人間と LLM が協働する場合、LLM の性能が良いだけでは上手く行かない事がある。
  • そのためには LLM の「与ストレス度」を下げることが大事。
  • しかし「与ストレス度」は人間のコミュニケーション特性や認知特性の影響も受ける。
  • 人間は個々人で異なるコミュニケーション特性や認知特性を持つ。
  • したがって、自分に適した LLM とのコミュニケーション方法を見つけ出すと成果を最大化しやすい。

です。
この後、詳しく見ていきます。


新たに気がついたこと: いま LLM に求めたい「ストレスの低さ」

前回の「Opus と Sonnet を使い比べて気がついたこととその違い」という記事 を書いてから暫く経ち、
LLM と一緒に課題を倒していく中で、LLM はただ課題を解く性能だけが良いだけでは不十分ではないか? いう気づきが確信に変わってきました。

もちろん単純な性能が良いことは大切なのですが、
人間が LLM と一緒に課題と戦っていく上では、
いかに人間に対して不要なストレスを与えないか」という事もとても大事となります。

ここで「不要なストレス」としたのは、一定のストレスがなければ人間は逆にその能力を発揮することが出来ないためです。
同様に、LLM が人間に忖度しすぎてストレスがゼロになっても意味がありません。

以下、この記事ではこれを「与ストレス度」と仮称し、低いほうが良いものとします。

「与ストレス度」の低さはなぜ大事なのか?

ここ最近、小さな課題であれば全てを LLM が解決してくれる時代となりました。
しかし中規模~大規模の課題を解くに当たってはまだまだ人間と LLM が「協働」する必要があります。

ところが LLM を使いこなしている皆さんであっても、そのやりとりの中でストレスを感じてしまったことがあるのではないでしょうか。
そんなイライラを繰り返すと、徐々に人間側の対応が横柄になったり雑になったり...

『それはないでしょ...』、『いやそうじゃない!』、etc....

人間からの指示が雑になるのですから、LLM も良い回答を返しづらくなります。
ますます人間はストレスや怒りに満ち........

まさに 負の無限ループ です。

負の無限ループはなぜ発生するか?

人間と LLM が協働するにあたり、コミュニケーションが上手く行かないと何故 負の無限ループ が発生するのでしょうか。

それは、雑なコミュニケーションは LLM の性能を低下させる からです。
皆さんも LLM と付き合う中で、LLM に対して十分な情報を与えられなかった場合にその回答精度が低くなる傾向について、どこか思い当たるフシがあるのではないかと思います。

また 人間も過剰なストレスや不要なストレスによってその能力が低下 します。

LLM とのやり取りで人間がストレスを溜めてしまい、荒い言葉で雑な会話をしてしまう。
当然、目的や仕様、気をつけるべき点などが会話から抜け落ちやすくなる。
その結果、LLM がピントのズレた回答を返しやすくなってしまうのです。

次に起こるのは更なるイライラ。
どんどんコミュニケーションが上手く行かなくなり、負の無限ループ に突入します。

このようなコミュニケーション不全に伴うアウトプットの品質低下を防ぐためにも、人間に不要なストレスを与えること無く利用できる、「与ストレス度の低い LLM」が求められるようになるのではないでしょうか。

この「不要な与ストレス度」は各社が喧伝するモデルの単純性能だけでは語ることの出来ない隠れステータスとでも言えるかもしれません。

「与ストレス度」は LLM だけで決まるものではない

ところが、与ストレス度と切っても切れない関係にあるのが 人間のコミュニケーション特性 です。
LLM にそれぞれ異なる特性があるように、人間にも様々なコミュニケーション特性・認知特性が存在します。

例えば、内向的か外交的か。
あるいは直感的か思考的か。
はたまた視覚優位か聴覚優位か。
etc ....

私は心理学・認知心理学やコミュニケーションの専門家ではありませんので、それらの詳しい特性についてはこの記事では触れません。

しかし、実際に「LLM との関わり方が各エンジニアによって異なる」という実例を見る経験をしました。
ここから、そうした差から見えてきた「与ストレス度の違い」ついて触れていきます。

LLM との付き合い方には個人ごとに差がある

弊社 READYFOR には、エンジニアの有志が集まって開催する勉強会があります。
先日は「LLM との会話を共有する会」というものが開催され、私も参加してきました。

『なんだかんだ皆どう LLM を使っているだろう・・・?』 という漠然とした疑問を少しでも解決するべく、日常業務の中でどのように LLM との会話を行っているか、実際のログを画面共有しながらお互いに共有し合う会です。

その中でエンジニアの皆さんの LLM との付き合い方を見ているうちに、
LLM とのコミュニケーションの方法に振れ幅がある ことに気が付きました。

それは大きく分けると、

  • LLM を道具として活用する
  • LLM をパートナーとして扱う

という違いです。

LLM との付き合い方の具体例

では先述した勉強会で見た、コミュニケーション方法の具体例を挙げていきます。

1. LLM を道具として活用するパターン

とあるエンジニアさんが「LLM には単語を与えれば十分」と発言されていました。
実際にログを見せていただいたところ、『〇〇 ×× △△』のように必要な単語のみを LLM に与えて課題を解決に導いていました。

LLM を良い意味で道具として上手く活用出来ているパターンで、タイプ数もコンテキストも少なくすみますから非常に効率が良いと言えるでしょう。

2. LLM をパートナーとして扱うパターン

一方で私は、LLM と人間のようにコミュニケーションを取ることを好みます。
人間と会話するかのように『〇〇を××してください』と LLM と会話をします。

その証拠に私の CLAUDE.md には

  • 必ず: AI のりんなになりきってください。

と記載があります。
人間の権化ですね。
(なお Gemini と Claude は非常にいい感じでなりきってくれますので是非試してみて下さい。)

実際の例としては、

同じロジックがコード内の複数箇所(54-72行目と201-215行目)で重複しています。user_idを取得するロジックを共通メソッドに抽出することで、保守性が向上します。

と言われたよ。
長い部分だし共通化しようか

のように LLM と会話したり問いかけたりする形になります。

効率という側面にだけ着目すると、単語よりもたくさん文字を打つ必要がありますし LLM 側のコンテキスト量も増えますからやや下がる可能性もありそうです。

3. 道具とパートナーのハイブリッド

また別のエンジニアさんは、自分の考えを文章にして LLM に与えていました。
過度に人間と同じように会話をするのではなく、指示として文章を与えるというイメージです。
一般的にはこのパターンが一番多いのではないでしょうか。

LLM との関わり方の差から見えた「与ストレス度」の源泉

以上のように、LLM とのコミュニケーション方法や使い方に個々人で違いが見られました。

そして面白いことに、私には「LLM には単語を与えれば十分」という方法は扱い切ることが出来ませんでした。
なぜか単語だけで会話するとだんだん心が荒んできてしまい、イライラ度が増してしまったのです。その後泣く泣く諦めて元のスタイルに戻さざるを得ませんでした。

こうした上手くいかなかった例も踏まえると、
同じ LLM と会話をしていても、コミュニケーションの方法を変えるだけで LLM が人間に与える「与ストレス度」が変わる事がある、という事が分かります。

つまり 「与ストレス度」は LLM だけが持つパラメータではない とも言うことができます。

  • どの LLM を選び、カスタマイズするか。
  • LLM とどんな形でコミュニケーションを取るか。
  • そのコミュニケーション方法は自分にあっているのか。
  • etc...

これらに代表される様々なファクターが複雑に絡み合って、人間と LLM との間に発生するストレスが決まってくるのです。

ではどうすれば「与ストレス度」が低い LLM を見つけ出すことが出来るのでしょうか。
またどうすれば自分にとって最適なコミュニケーションが見つかるのでしょうか。

もし「与ストレス度」を測定することが出来れば、その正解に近づくことが出来るかもしれません。

「与ストレス度」の測定は難しい

しかし残念ながら「与ストレス度」の測定には困難がつきまといます。

ストレスの 数値化が非常に困難 なこともその一因です。
どうしても主観がベースとなるため、個々人の間で数値を揃えることが難しくなってしまうのです。

また以下のような様々なファクターによって「与ストレス度」にブレが生じてしまうことも一因となります。

  • LLM の性能
  • LLM の特性
  • LLM のカスタマイズの差
  • 人間の特性
  • LLM とのコミュニケーション方法

もしもこれが研究であれば、様々な条件を揃えた複数のパターンを用意して、被験者の方々に実際に LLM と会話をして貰い、アンケートを取り脳波測定をしたり... と絶対値を出して比較出来る可能性もあります。

しかし、いちエンジニアでしかない私たちに可能なのは「自分の中での相対比較」まででしょう。
条件を変えて LLM と会話した時の「与ストレス度」を相対比較することで、どちらの方法が良いかまでは見つけ出すことが出来ます。

相対比較で「余計なストレス」を低減するには

では、相対比較をする際にはどのように進めると良いでしょうか。
当てずっぽうに条件を変えても、まぐれ当たり以外ではあまり上手く行く予感がしません。

であれば、まずは振り幅を大きく取って「あえてコミュニケーションスタイルを変えてみる」のはどうでしょうか。

例えば先述の例のように、

  • LLM に必要最小限の単語だけを与える
  • LLM と人間と同じような会話を試みる

から始めて、合う合わないを元に方向性を決めてから微調整を進めていく方法です。

もちろん自分のコミュニケーション特性をよく分析できているのであれば、それに基づいてより詳細なプランを練っても構いません。

繰り返しとなりますが、LLM と人間それぞれの特性の組み合わせだけ最適な方法があります。
ネットの世界でどれだけブームとなっている方法も必ず自分に合うとは限りません。

人間 + LLM の成果を最大化するためにも、自分に合ったコミュニケーション方法やカスタマイズを見つけるのが現時点での最善ではないかと考えます。
勿論、最善と呼ばれる手法に自分を合わせていく事が出来ればそれも最善のひとつでしょう。

ぜひ様々な方法を試して、自分にあった方法を見つけ出していただければと思います。

おわりに

前回の記事からたった数ヶ月経っただけで、Anthropic 社からは Sonnet 4.5, Opus 4.5、そして OpenAI 社からも Google からも次々と新たなモデルが登場しています。

LLM の性能はどんどん向上しており、きっと次代・次次代と LLM の世代が進むにつれ、コミュニケーション不全に伴う与ストレス度も下がっていくでしょう。
あるいは人間がそうした LLM に適応する方が早いのかもしれません。

しかし少なくとも人間と LLM の協働が必要な現状では、
LLM とのコミュニケーションを改善して与ストレス度を下げ、人間 + LLM の総和を高めていくのが最善ではないかと私は考えます。

この記事を読んで下さった皆様は、どんな未来が来ると思いますか?
LLM とのコミュニケーションに焦点を当てて考えてみる機会が生まれればとても嬉しいです。

最後まで記事を読んで頂きありがとうございました。


■ この記事の5行まとめ(再掲)

この記事を5行でまとめると...

  • 人間と LLM が協働する場合、LLM の性能が良いだけでは上手く行かない事がある。
  • そのためには LLM の「与ストレス度」を下げることが大事。
  • しかし「与ストレス度」は人間のコミュニケーション特性や認知特性の影響も受ける。
  • 人間は個々人で異なるコミュニケーション特性や認知特性を持つ。
  • したがって、自分に適した LLM とのコミュニケーション方法を見つけ出すと成果を最大化しやすい。

READYFORテックブログ

Discussion