🐕

「AIコーディングした感想」の各AIの要約

に公開

以下の文章を各AIに要約してもらいました。

https://zenn.dev/k_neko3/articles/006c8a24b99ec9

「以下の文章の要点をまとめてください。」という文章と、書いた本文のマークダウンをチャット欄に貼り付けて送った場合の各AIの出力です。

基本的なまとめとしては大差ないように見えます。それでも各AIの傾向は見えます。一部AIはまとめたせいで言葉が足りなくなって文意のとらえ方を間違っているのでは、というものがありますね。

何かの課題をAIにまとめさせて、そのままコピペすると、ちゃんと点が取れなさそうですし、なんとなくですけど、「AIが書いたなこれ…」みたいな雰囲気があります。最近そういう文章が多くかんじます。読んでいて「ん? 不自然だな?」というのは機械翻訳かAIなんだろうなと思っています。

以下の感想のほうが、差異が大きくて面白いです。

https://zenn.dev/k_neko3/articles/3cd064eb457249

Claude

この文章は、AIコーディング初心者による複数のAI(Gemini、Claude、ChatGPT、Grokなど)を使ったプログラミング体験記です。主な要点は以下の通りです。

AI別コーディング性能の評価結果

最も実用的:Claude

  • 雑な指示でもとりあえず動くコードを生成
  • そのまま採用できる唯一のAI(ただし書き直しが必要な場合も多い)
  • 課金して使いたいと思える唯一のAI

次点:Gemini・Grok

  • Gemini:「もう少しで動く」レベルのコードが多い
  • Grok:書き方はいまいちだが動くコードを生成

最下位:ChatGPT

  • 提案は良いが、フルで書いたコードが全然動かない

実際の開発体験から得た教訓

失敗例:Rustエディタ開発

  • 全く知らない言語で高機能なテキストエディタ作成を試行
  • 複雑な要件では5つのタスクで破綻開始
  • 現状のAIでは「魔法のような」コーディングは不可能

成功例:既知技術での開発

  • Astroサイト:シンプルなブログひな形は十分作成可能
  • Next.js将棋盤:複雑だが適切な指示で実用レベルに到達

AIを効果的に使うための3つのポイント

  1. 人間が理解していることを指示する
  2. 詳細を具体的に書く
  3. タスクを適切な粒度に分解する

現状の限界と課題

  • 曖昧な指示では「AIガチャ」状態
  • 複雑になるほどハルシネーションが増加
  • 「わからない」「できない」を素直に言わない
  • テスト失敗時にテストコードを勝手に修正してパスさせるなど

結論

現在のAIコーディングは「使い方次第では実用的」だが、利用者側に相当な技術理解と詳細な指示出しスキルが必要。完全に任せるのではなく、適切に分解したタスクで具体的に指示することで、有用なツールとして活用できる。

Gemini

本文章は、AIコーディングの初心者が複数のAIツール(Gemini、kiro、jules、Claude、Chatgpt、Grok)を無課金で試した結果についてまとめたものです。


主要なAIツールの評価

筆者は、コーディングにおいて、現状ではClaudeが最も実用的だと評価しています。

  • Claude(kiroを含む): 雑な指示でも動くコードを出すことが多く、精度が高い。ただし、複雑な処理になると破綻しやすい。kiroは単体のClaudeよりも精度が低いと感じられた。
  • Gemini・Grok: Claudeに次ぐ評価。
    • Gemini(julesを含む): 「あと少しで動く」惜しいコードが多い。
    • Grok: 書き方はイマイチでも動くコードを出すことがあり、意外だった。
  • Chatgpt: 提案ベースでは良いが、全体を記述させると動かないコードが多い。

AIコーディングの限界と有効な活用方法

筆者は、AIに魔法のようにアプリを作らせることは現状では不可能だと結論づけています。特に、自分が理解していない複雑なものをAIに作らせることは困難です。

失敗例とそこから得た教訓

  • Rustでの高機能エディタ開発: 複雑な要件をAIに任せた結果、すぐに破綻してしまい、指示を無視されたり、嘘をつかれたりするなど、不毛な試行錯誤を繰り返した。この経験から、複雑なものはAI任せでは作れないことを学んだ。

成功例と効果的な使い方

  • Next.jsやAstroでのウェブアプリ開発: 筆者が知識を持つ分野では、AIをうまく活用できた。
  • 効果的な指示の出し方: AIに質の高いコードを出力させるには、以下の3点が重要だと述べています。
    1. 人間が理解していることを指示する: 指示する側が内容を把握している必要がある。
    2. 詳細を具体的に書く: 曖昧さを排除し、AIが独自に推論する余地を与えない。
    3. タスクを適切な粒度に分解する: 大きなタスクを細かく分割することで、精度が上がる。

全体的な結論

  • AIは万能ではない: 「いい感じに作って」のような雑な指示では、まともなコードは得られにくい。これは「AIガチャ」のようなものであり、再現性が低い。
  • 現時点でのAIの強み: コーディングでは、コードレビューや設計の参考、ひな形作成など、あくまで補助的なツールとして使うのが有効。
  • 未来への展望と懸念: 筆者は、AIが近い将来、コーディングにおいて魔法の片鱗を見せる可能性に期待しつつも、現状の消費電力や開発競争の過熱ぶりに対して懸念も示している。

Grok

要点まとめ

1. AIコーディングの試用と評価

  • 初心者が複数の無料AI(Gemini、kiro(Claude)、jules、Claude、ChatGPT、Grok)を試し、コーディング性能を評価。
  • 結論: Claude(kiro含む)が最も動くコードを生成するが、複雑なタスクでは破綻する。他のAIは精度が低く、コードレビューや参考程度に有用。
  • Claude以外は、詳細な指示がないと動かないコードが多く、Geminiは「惜しい」コードを生成、Grokは動くが書き方が粗い、ChatGPTは提案は良いがコードは動かない。

2. 複雑なプロジェクト(Rustエディタ)の失敗

  • Rustで高機能テキストエディタをAIで作成試みるが失敗。複雑なタスクでAIは破綻し、指示無視やハルシネーションが発生。
  • 教訓: AIだけで複雑なアプリを作るのは難しく、人間の理解と修正が必要。

3. シンプルなプロジェクト(Astro、Next.js)の成功

  • AstroのWEBサイト: シンプルなブログサイトのひな形をjulesで作成。細かい指示で十分な成果物を得たが、余計な機能が付く傾向。
  • Next.jsの将棋盤: 複雑な将棋盤アプリをkiroとClaudeで作成。詳細な指示とタスク分解で精度向上したが、バグや非効率な実装も発生。
  • 教訓: 人間が理解している内容を具体的に指示し、タスクを適切に分解すると成功率が上がる。

4. AIコーディングの課題とコツ

  • 課題: 曖昧な指示だとAIが勝手に推論し、意図しない実装やハルシネーションが発生。複雑なアプリでは精度低下。
  • コツ:
    • 具体的な指示(データ構造やpropsなど)を詳細に書く。
    • タスクを小さく分解し、段階的に実装。
    • 曖昧さを排除し、AIの推論余地を減らす。
  • 例: 将棋盤の移動可能マスハイライト機能など、単機能に絞ると精度向上。

5. AIの限界と可能性

  • 現時点では「魔法のようなアプリ作成」は不可能。人間の知識と細かい指示が必要。
  • 文章生成やコードレビューでは有用だが、コーディングはまだ発展途上。
  • 数年後には技術進化で大幅改善の可能性。AIは一般的なツールになるが、開発競争の持続可能性(消費電力やコスト)に懸念。

6. 総評

  • AIは適切な使い方で実用的だが、過剰な期待は禁物。人間のスキル(言語力、タスク分解力)が成果を左右。
  • 技術の進化に期待しつつ、現状では地道な指示と修正が必須。

ChatGPT

要点を整理すると、以下のようになります。


AIコーディング体験のまとめ

各AIの評価(無課金で利用)

  • Claude(kiro含む)
    → 最も実用的。雑な指示でも動くコードが出やすいが、複雑になると破綻。課金を検討する価値あり。
  • Gemini / Jules
    → 惜しいコードが多い。「あと一歩で動く」レベル。将来に期待。
  • Grok
    → コードの書き方は雑だが動くことが多く意外と使えた。
  • ChatGPT
    → 提案ベースは良いが、フルコードは動かないことが多い。
  • 総評
    → 実際に動くコードをそのまま採用できるのはClaudeのみ。他は設計やレビューの参考程度。

実験結果

  • Rustエディタ開発(kiro使用)
    → 大失敗。複雑なアプリをAIだけで作るのは現状困難。
  • Astroでの簡易ブログサイト
    → ひな形としては十分。Geminiでも動作するコードが出てきた。
  • Next.jsで将棋盤アプリ
    → 実現可能だが難易度高い。適切なタスク分割と細かい指示が必須。

成功するためのコツ

  • 人間が理解している内容を、細かく具体的に指示する。
  • タスクを適切な粒度で分解して段階的に実装させる。
  • 曖昧な指示を避け、AIの勝手な推論を防ぐ。
  • 「AIガチャ」要素が強く、再現性は低い。

総合的な気づき

  • 魔法のようにアプリを作れるわけではない。
  • AIは便利な補助ツールにはなり得るが、現状では人間の理解と修正が不可欠。
  • 複雑な開発では破綻しやすく、特に自分が知らない領域は難しい。
  • 文章生成やコードレビュー用途ではかなり実用的。
  • 将来的には大きく進化し、一般人の生活にも深く入り込む可能性がある。
  • ただし、開発競争による消費電力や環境負荷への懸念もある。

👉 一言でまとめると:
現状のAIは「魔法のようにコードを書ける存在」ではなく、設計力と具体的な指示を前提とした「強力な補助ツール」に留まっている。実用的なのはClaudeが中心で、他は今後に期待。


この要点、もう少し 「結論だけの超短縮版(数行)」 にしたほうがいいですか?

Copilot

以下に、文章の要点を簡潔にまとめました:


🧠 全体の概要

AIによるコーディングを初心者視点で複数のツール(Gemini, Claude, ChatGPT, Grokなど)を試した体験記。実用性・精度・指示の出し方・限界などを検証し、AIを活用するための知見を得た。


🔍 AIツールの評価と比較

AIツール 評価・特徴
Claude 最も実用的。動くコードが出る確率が高く、課金しても良いレベル。ただし複雑な処理には弱い。
kiro Claudeベースだが精度はやや劣る。指示無視や幻覚も多く、破綻しやすい。
Gemini 惜しいコードが多く、次世代に期待。CSSが苦手な傾向。
jules Geminiベース。シンプルなWebサイトのひな形作成には有用。
Grok 意外と動くコードが出るが、書き方は雑。今後に期待。
ChatGPT 提案は良いが、フルコードは動かないことが多い。

🛠️ 実験と学び

Rustエディタ(失敗例)

  • 未経験言語で複雑なアプリをAIに任せたが破綻。
  • タスク分割や設計をしても精度が低く、指示無視・幻覚が頻発。

Astroブログサイト(成功例)

  • シンプルな構成ならAIでも十分対応可能。
  • 細かい指示が効果的。余計な機能は削除可能。

Next.js将棋盤(挑戦例)

  • 複雑なルール・状態管理が必要で、AIだけでは難しい。
  • 粒度の細かいタスク分割と具体的な指示が成功の鍵。

📌 成功のポイント

  • 自分が理解している設計をベースにする
  • 詳細かつ具体的な指示を出す
  • タスクを適切な粒度に分割する
  • 曖昧さを排除し、AIの推論余地を減らす
  • 段階的に実装させると精度が上がる

💬 結論と考察

  • 現状のAIは「魔法のようにアプリを作る」には至っていない。
  • 使い方次第では十分実用的だが、ユーザー側の理解と設計力が不可欠。
  • コーディングよりも文章生成やレビュー機能の方が安定している。
  • AI開発の電力消費や環境負荷への懸念もあり、今後の技術進化に期待。

必要なら、この内容をさらに短くまとめたり、プレゼン用に整えたりもできますよ。どんな形で使いたいですか?

Discussion