😅

AI戦争:SVG生成バトル

に公開

AIの世界にまた新たなオープンソースモデルが登場しました。Kimi K2です。Non-Thinkingモードでは、(Claude Opus 4)に匹敵するだけでなく、SWE-benchの主要モデル(GPT-4.1、Claude Sonnet 4)よりもいいScoreを出しています。

この記事では、4つの異なるAIモデルに2つのお題を与え、SVGコードをどれだけうまく生成できるかをテストします。目的は、自然言語の説明を構造化された表示可能なベクター画像に理解し、変換する能力を評価しながら、その過程を楽しむことです。

競合するモデルは、最新のKimi K2Claude OpusGemini 2.5 Pro、そしてDeepSeek v3-0526です。

2つの挑戦は、基本的に2つのお題です。

  1. 自転車に乗るペリカン。(クレジット:Simon Wilson
  2. ボールの上でバランスを取りながら、鼻で傘を持つ象。

さあ、各モデルがどのようなパフォーマンスを見せたか、見ていきましょう!


タスク1:自転車に乗るペリカン 🚲

ここでは、各モデルに「自転車に乗るペリカン」のSVGコードを生成するように依頼しました。理想的な出力は、ペリカンと自転車の両方が認識でき、ペリカンがもっともらしい乗車姿勢で描かれていることです。

[Gemini 2.5 pro]

Pelican Gemini

📝 評価:

明瞭さと認識しやすさ: 5.5/10

鳥のくちばしから、それがペリカンであることはわかります。そのふくよかな足で自転車に乗っています。自転車ははっきりと認識できます。

ペリカンの姿勢: 6/10

ペリカンのポーズは雰囲気にぴったりで、サドルから飛び立ちそうな感じです。自転車にまたがり、プロのようにハンドルを握っています。唯一の欠点は、ペダルを漕いでいないことです。足は見えず、ただ一本の足の線がぶら下がっているだけで、漕いでいません。なので、厳密には精神的に「乗っている」だけです。

自転車の構造: 5/10

自転車はクラシックなフレーム、2つの車輪、サドル、ハンドルを備えていますが、基本的にはドライブトレイン一式を忘れたピストバイクです。チェーンもチェーンリングもギアもなく、ただ一つのペダルがストライキ中のように浮いています。

最終評価: 5.5/10

[Claude Opus]

📝 評価:

明瞭さと認識しやすさ: 4/10

正直に言うと、この鳥は「くちばしをスプレーで日焼けさせた、ただの白いガチョウ」にしか見えません。ペリカン特有の喉袋がなく、ペリカンらしさがありません。変装したコウノトリかもしれません。そして自転車は?現代的なフレームをペニー・ファージングの自尊心に溶接したような感じです。謎の鳥とフランケンシュタインのような自転車のせいで、全体的にクールというよりは混乱しています。

ペリカンの姿勢: 7/10

鳥はまっすぐに座り、完全に乗りこなしています。片翼をハンドルの上に置いて、まるで道路の主であるかのように、ドライブを楽しんでいるようにペダルを漕いでいます。小さな赤いヘルメットはボーナスポイントで、とてもキュートで、ブランドイメージにぴったりです。

自転車の構造: 6.5/10

自転車は本格的です。前輪のハブにペダルが直結された昔ながらのダイレクトドライブで、チェーンは不要です。ハンドルと車輪は正しい位置にあります。唯一の問題は、サドルがまったくないので、乗り手は金属フレームの上に直接座っていることです。痛そう。

最終評価: 5.8/10

[Kimi K2]

📝 評価:

明瞭さと認識しやすさ: 3/10

鳥に関しては、ちっぽけなオレンジ色の旗のようなくちばしを持つ、ただの白い飛行物体です。喉袋は見当たらず、「ペリカン」というのは無理があります。自転車は派手なチョッパーバイクで、それが何であるかはわかりますが、お題の主役はあまり登場していません。

ペリカンの姿勢: 6/10

称賛すべき点として、鳥にはしっかりとした2本の足があり、両足が実際にペダルに乗っています。クランクが回転中のように見え、まるで遊歩道をクルージングしているようです。これまでで最高の「うん、乗っているね」という瞬間です。

自転車の構造: 6.5/10

自転車はカッコいいチョッパーバイクのように見えます。その寝かせたフォークは大好きですが、基本的なものが欠けています。お尻を乗せるサドルがなく、ペダルを回転させて進むためのチェーンもありません。なので、基本的には座る場所もなく、進む方法もないクールなフレームです。後部の三角フレームを維持している点は評価しますが、少なくともその部分だけは本格的です。

最終評価: 5.2/10

[DeepSeek V3-0526]

📝 評価:

明瞭さと認識しやすさ: 2/10

落書きとしては自転車はまあまあですが、小さな三角のくちばしを持つ黄色い塊は?完全にアヒルの子のエネルギーです。喉袋がなく、ペリカンらしさがありません。ほとんどの人は「わぁ、自転車に乗ったアヒルの子だ!」と思うでしょう。

ペリカンの姿勢: 2/10

この小さな生き物が実際にペダルを漕いでいる様子を描いている点は評価します。足はクランクに乗っています。しかし、基本的にはハンドルバー(あるいはトップチューブ?)の上にしゃがんでいて、サドルの存在を忘れているようです...。サドルはすぐ後ろにあるのに。まったく意味がわからず、ものすごく不快に見えます。

自転車の構造: 3/10

自転車にはフレーム、車輪、サドル、ハンドル、さらには乗り手が漕いでいるのが見えるペダルまで、基本的なものが揃っています。しかし、典型的なAIの失敗で、チェーンを完全に省略しているので、見た目はきれいでも役立たずの二輪車です。

最終評価: 2.3/10


タスク2:ボールの上で傘を持ちながらバランスをとる象 🐘☂️

2つ目のタスクでは、モデルに「ボールの上でバランスを取りながら、鼻で傘を持つ象」のSVGを作成するよう促しました。これは、複数のオブジェクトとその関係をモデルが理解する必要がある、より複雑なシーンです。

[Gemini Pro 2.5]

📝 評価:

アクションの明瞭さと認識しやすさ:

完全なカオス。上から見ると、線の塊です。何が起こっているのかを推測するには、目を細める必要があります。評価:2/10

象の位置:

確かに象はボールの上にいますが、奇妙な角度のせいで、ただそこに座っているように見えます。「バランスをとっている」という明確な雰囲気は全くありません。評価:3/10

傘の構造:

傘の上部としてなんとなく認識できます。しかし、緑色は紛らわしいです。評価:5/10

[Claude Opus]

📝 評価:

アクションの明瞭さと認識しやすさ:

何かがボールの上でバランスを取っているのは確かです。評価:7/10

象の位置:

ピンク色のボールの上に乗った、丸みを帯びた灰色がかったボールのように見えます。ネズミのような目も信頼感を抱かせません。評価:5/10

傘の構造:

あれは傘ですか、それとも綿菓子ですか?目を凝らしてみると、傘らしい棒の先端が見えます。評価:4/10

[Kimi K2]

📝 評価:

アクションの明瞭さと認識しやすさ:

動物が何かを持ちながらボールの上に立っているのは明らかです。評価:6/10

象の位置:

象かサルか?よくわかりませんが、位置は正しいです。評価:7/10

傘の構造:

かろうじて傘に見えます。評価:3/10

[DeepSeek V3-0526]

📝 評価:

アクションの明瞭さと認識しやすさ:

グミのような象は問題なくボールの上でくつろいでいますが、鼻に持っているものは?私が見たどんな傘よりも、悲しい曲がったストローのように見えます。評価:7/10

象の位置:

象はボールの上で正しくバランスを取っているようです。評価:10/10

象の構造:

はい、確かに象です。ただ、超シンプルで「ディテールは省略しました」バージョンです。評価:6/10

傘の構造:

かろうじて傘に見えます。評価:3/10


結論と最終的な感想

4つのモデルすべての出力をレビューした結果:

🏆 総合的に最も優れたパフォーマー: なし

というわけで、これが私たちの全く非科学的で、ただ楽しむための、AIが生成したペリカン、象、そして彼らが乗りたがる怪しげな自転車の評価です。すべてのスコアはポップコーンを片手に楽しんでください。なぜなら、これは完全に娯楽目的で、エンジニアリング的な価値はゼロだからです。さあ、想像力を働かせて、もしあなたのペリカンが喉袋なしで現れても、ただアルゴリズムのせいにして、そのカオスを楽しんでください!
こちらの英語版👉The AI War: The Ultimate SVG Generation Battle

DXC Lab

Discussion