✈️

生成AIサービスをいろいろ紹介してみた

に公開

はじめに

ここ1年程度の生成AIの進化はすごく速いですよね。
文章生成や検索、文字認識、アプリケーション開発、デザイン・UIの作成など、さまざまな分野でAIが活躍しています。
しかし、IT業界の人、エンジニアの人でも生成AIサービスを積極的に活用できている人ってあんまりいないんじゃないかな、と私は考えています。私の周りでもIT知識はあるけど生成AIはChatGPTのような有名なもの以外は何も知らない、という人が多いです。
そこで、私はより多くの人に生成AIを使ってほしい、知ってほしいという思いで、現在注目されている生成AIサービスを一挙に紹介してみました。
開発者やクリエイター、あるいは単純に生成AIに興味がある人に向けて、それぞれの特徴を簡単にまとめています。

まずは汎用的なモデルから

ChatGPT(https://chatgpt.com)

特徴:GPTsが豊富である。DeepResearchは有料プラン($20~)から使用可能。音声認識にも対応している。
最近4oの性能が下がっているような気がしている(確証はないが何人か同じ意見を述べている人がいた)。また、Canvasは使いにくく、あまりユーザーライクではない。

Claude(https://claude.ai)

特徴:コーディング分野においてはChatGPTやGeminiを上回る性能を持ち、生成された文章もchatGPT、Geminiと比較してより自然である。またアーティファクトが非常に見やすく使いやすい。
しかし、無料版だと1チャットにおける会話可能回数が少なく、コーディングにおける長文のエラーなどを張り付けたりするとすぐに制限が来てしまう(そうなった場合再度チャットを作成する必要があり面倒)。

Gemini(https://gemini.google.com/app)

特徴:上2つのモデルと比較して大きな性能差はない。
このAIの最新モデル(2.0 Flashなど)は、カタログスペックではClaudeやChatGPTを上回るとされているが、私の体感ではコーディング性能はClaudeより低いと感じる。
無料でDeepResearchを使用可能。
ただ、1つ大きなポイントとしてAPIを無料で使用することができる点がある。学生はGithub Copilotを無料で使用できるためわざわざGeminiAPIを使用することはないと思うが、それを除くと最もコスパが良い。

Grok(https://x.ai)

特徴:(こちらの文章はGrokで生成)
xAIが作ったAIで、人間らしいユーモアと外部視点での回答が得意。また、無料で、なおかつユーザー登録をせずに使える点が大きな魅力(無料がいつまで続くかは不明)。科学や宇宙に関する質問に強く、ストレートで分かりやすい説明が特徴である。
無料でDeepResearchを使用することができる。コーディング性能もClaudeと並ぶレベルで高い。

DeepSeek(https://chat.deepseek.com)

特徴:コード生成や数学的な問題解決に優れている。しかし、生成スピードは他モデルよりも遅くなっている。また、入力した情報は〇国政府に流れている可能性が高いので入力する際は注意が必要。

AIエージェント(IDE)

Cursor()

VScodeのクローンでAIエージェントとチャットをしながら開発が可能なIDEである。
この後紹介する他のIDEにも共通していることであるが、ファイルの内容だけでなくやディレクトリ構成、ワークスペースなども認識可能である。
初回はお試しでPro版をそこそこの回数で使用することができる。
エージェントモードに加えて、自身でPlanモードやリファクタリングモード等のカスタムモードを自由に追加するなど幅広い用途で活用できる。
FigmaのMCPを接続することにより、FigmaのURLを渡すだけで実装まで行ってくれる。
モデル選定について、私が使用する中では、実装系や実装計画の策定はClaude Sonnet 4、リファクタリングやコードレビューはgemini-2.5-proが適していると感じる。

Windsurf()

Cursorと同様にVScodeをクローンしたAIエージェント搭載のIDEとなっている。
初回はトライアルで100クレジットが与えられ、Pro版の機能を使用することができる。
体感ではCursorよりも精度が低く、指示した通りに実装を完了してくれることは少ないように感じる。
また、AnthropicからClaude利用を締め出されている点でもCursorには及ばない。

Kiro()

2025年7月にAWSからリリースされた、AIエージェントを搭載した新たなIDEである。2025年7月現在ではプレビュー版のため無料で使用できるが、今後は有料となっていく見込みである。
他と異なる機能としてVibeモードとSpecモードがあり、Vibeモードは他と同様のAIエージェントであるが、Specモードでは実装計画を立てて実装を進めることができる。
初めからVibeモードで実装を指示するとそこまで精度は高くない印象だが、Specモードで計画を立ててから行うとそれなりの精度で実装をしてくれる。
ただ、ドラッグアンドドロップでディレクトリをチャットに渡すことができない?ためその点は若干不便である。

Cline/Roo Code

VScodeの拡張機能としてこのAIエージェントが提供されている。
精度はまちまちだが開発速度が速く、CursorよりもRoo Codeを愛用している人も多い。
また、コンテキストウィンドウがすぐに埋まってしまう問題を抑制できるIntelligent Context Condensingが導入された。
次に紹介するAIエージェントのClaude Codeと比較されることが多い。
差分は以下の資料が非常にわかりやすい。
(https://speakerdeck.com/pharma_x_tech/roo-codetoclaude-codebi-jiao-sitemita?slide=13)

AIエージェント2

Claude code()

調査中

Gemini Cli()

個人のGoogleアカウントでログインすれば、1分あたり60リクエスト、1日あたり1,000リクエストまで無料で利用可能。
より多くのリクエストが必要な場合は有料のGemini APIやVertex AIの従量課金、有償版のGemini Code Assistライセンスもしくは企業等のGWSアカウントを利用することもできる。
また、上記の有料系アカウントであればプロンプト、生成された回答、関連するコードなどが収集されることはないので業務で使用する際は有料アカウントの利用が必須となる。

Devin(https://devin.ai)

無料版は無いに等しい。
AIエージェントの中でも特に商用版としてしっかりと構築されている印象。
完全自立型AIエージェントであり、指示を与えるとAIが自分で考え自動で様々な操作を実行する。
能力的には1~3年目のジュニアエンジニア程度なので過信は禁物である。
Devin自身がスナップショットを撮ってUIを確認することもできる点や、テキストだけでなくPowerPointファイルやzipファイルも読み込み可能である点がCursorやCLIエージェントとの大きな差別化点となる。

AI検索エンジン

Felo(https://felo.ai/search)

特徴: 検索内容をもとにプレゼンテーション資料を作成してくれる。DeepResearchを無料で使用可能。また、見出しや太字などを多く活用していて文章が読みやすい。

Perplexity(https://www.perplexity.ai)

特徴: DeepResearchを無料で使用可能。しっかりとソースを提示してくれるが、意外と文章の中で「これどこから取ってきたんだろう」という情報があったりする。
欠点としては、文章に太字などは活用されていないため多少読みにくさを感じることがある。

Genspark(https://www.genspark.ai)

特徴:DeepResearchを無料で使用可能。他の2つと比べるとあまり使用されていない印象。ただし、複数のAIエージェントによる多角的な検索が行われるため専門的な内容の検索に向いている。

フルスタックアプリケーション開発

bolt(https://bolt.new)

特徴:ブラウザ上でフルスタック開発が可能だが、現状はPythonなどの実行はできない。npmパッケージのインストールやデプロイもAIが自動で行ってくれる。また、https://bolt.new/github.com/ユーザー名/リポジトリ名 とするとboltのページでリポジトリを読み込み、そこからリファクタリング等を行うことができる。

Lovable(https://lovable.dev)

特徴:Supabaseなどバックエンドとのスムーズな統合を実現している。また、ガイドなどがあって使い勝手も良いため開発初心者におすすめ。また最近になってFigmaと連携することもできるようになったようである。

v0(https://v0.dev)

特徴:フロントエンドに特化している。Next.jsやShadcnとの高い互換性があり、UIコンポーネントを即座に生成できる。デザインページの画像を渡すとかなり高精度でそのページのコードを作成してくれるので、モック作成などには最適。

a0(https://a0.dev)

特徴:v0をそのままネイティブアプリに特化させたようなもの。React Nativeが生成される。

Create(https://www.create.xyz)

特徴:自然言語で簡単にフルスタック開発ができる。また、特定の部分のみの修正を行うこともできるため柔軟性が高い。

UI・デザイン系

Relume(https://www.relume.io)

特徴:AIでウェブサイトの設計を支援するツール。テキスト入力からサイトマップやワイヤーフレームを生成する。

Napkin(https://www.napkin.ai)

特徴:アイデアをビジュアル化するAIツール。テキストから図解やフローを瞬時に生成する。

Magic Patterns(https://www.magicpatterns.com)

特徴:UIコンポーネント生成に特化したツール。プロンプトから読み取ったデザイン要素を提案する。

Wegic(https://wegic.ai/ja)

特徴:AIでウェブページやUIを生成する。

shuffle(https://shuffle.dev/new)

特徴:UIライブラリとAIを組み合わせたツール。ドラッグ&ドロップで直感操作が可能。

uxpilot(https://uxpilot.ai)

特徴:AI駆動のUI/UXデザインツール。ワイヤーフレームからUIまで生成可能。

Uiverse(https://uiverse.io)

特徴:オープンソースのUIコンポーネントライブラリ。

文字起こしAI

Tactiq(https://tactiq.io)

Zoomやgoogle meet、Teamsに対応していて、ミーティングに文字起こし用アカウントのようなものを参加させずに文字起こしが可能。無料でも月に10回使用できる。
また、作成した文字起こしデータ(議事録)をNotebookLM等に保存するようなワークフローを構築することもできる。

tl;dv(https://tldv.io/ja)

Zoomやgoogle meet、Teamsでのミーティングを無料で、なおかつ無制限で文字起こし可能。また、Tactiqは音声のみ記録可能だが、このサービスは録画にも対応している。
しかし、ミーティングにtl;dvのボットが参加するためミーティング相手に別途説明が必要となる場合がある。

OCR AI

Mistral OCR(https://mistral.ai/news/mistral-ocr)

画像やPDFを受け取り、その中のテキスト、表、数式、写真などを認識し抽出できる。
現状でもっともOCRの精度が高いといわれている。
使用するためには別途Mistral AIのAPIkeyを取得する必要がある。

Discussion