🍣

<開発AIツール比較デモ会!ChatGPT・Claude・Cline・Replit>の実施メモ(20250420実施)

に公開

アーカイブ動画

https://www.youtube.com/watch?v=LiR4wfu5HSk

そもそもLLMって何なの?→カレールーと〇〇カレーの関係。

LLMとかモデルと呼ばれるもの

カレールーみたいなもの。
大規模言語モデル。文字を入れたらそれに合った文字を出力するもの。
この出てくる文字が、高精度かつ汎用的で、万能。

そうでもないもの

カレーから派生する、ビーフカレーとかマトンココナッツカレーみたいなもの。
LLMを利用したサービス。

※実際は、モデル名とサービス名が渾然一体となって呼ばれることが多い。

前提はさておき、見てみよう・触ってみようぜ!

デモします!
百聞は一見にしかず。百見は一触にしかず。一緒に触ってみると吉。
(後でアーカイブ動画を公開するので、見てても可。)

1.LLM単体+本家のWebサービス

ChatGPT

OpenAI社製のLLM。(厳密にはGPTがモデル名で、ChatGPTはサービス名)
新モデルが最近リリースされて話題。

  • o3(高度な推論、早い)
  • o4-mini(推論、もっと早い)

Claude

読み方はクロード。Anthropic社製のLLM。
高精度で汎用的な出力が特徴。特にコード系が強い。
Artifact(アーティファクト)という、ブラウザ上で成果物を表示できる機能が秀逸。
最近3.7 Sonnetという強いモデルが出た。

Gemini

読み方はジェミニ。Google社製のLLM。
APIが無料枠で使える、たぶん唯一のLLM。(そのうち有料になるかも)
(今回はこれ以上は割愛。私があんま詳しくないので)

ざっくり全体感

3強+αという構図。

  • ChatGPTとかGPT(OpenAI - Microsoftの陣営)
  • Claude(Anthropic - Amazonの陣営)
  • Gemini(Google)
  • その他:Llama (Meta) 、DeepSeek(DeepSeek)

2.LLMを活用したAIサービス

Roo Code

VSCodeの拡張機能。
コード系の操作に関して、ローカルで自動で何でもやってくれるという感じ。
(強い人だと、そこからAWS上でデプロイとかやってるっぽい。CLI操作でできることは多分何でもできると思われる。)
GitHub Copilot経由で使うと、GitHub Copilotのサブスクだけで使える(が、後述の注意参照。)
旧名 Roo Cline。Clineというサービスの派生系で、Clineと検索した方が情報出てくるかも。

Replit Agent

Webブラウザ上で使用する、アプリ自動生成AIサービス。
裏ではGPTとかClaudeとかが動いてるっぽい。

補足:LLMやサービスを利用する上での注意点

ちゃんと価格やプランを調べてから使おう!

  • APIは大体従量課金制で、使った分だけ課金される。(ChatGPTとかClaudeとかのプランとは別)
  • GeminiのAPIもそのうち有料になるかも。
  • Replitで作ったアプリは、実施する中で別途従量課金的な何かがかかるみたい。
  • 今回のGitHub経由Roo Codeは、使いまくったら不正な利用扱いでGitHubアカウントが停止されたという情報もあり。諸々調べて責任の取れる範囲で使ってください。

補足:今回使うプロンプト

ChatGPT向け

使用するプロンプト

私が所属する会社は〇〇株式会社である。その会社の情報を調査してまとめて。

Claude向け

使用するプロンプト

Roo Code向け

使用するプロンプト

個人向けのオンライン学習サイトを作って。

要件は以下。
・学習ロードマップのページを作る。(今回はトップページにして、3個の学習コンテンツを表示する)
・個々の学習のページを作る。(今回は3ページにする)
・特定のYoutube動画を再生したかどうかを判定する。(今回はモックアップ用に、URLは全て次のものを指定せよ。https://www.youtube.com/watch?v=M7lc1UVf-VE)
・Youtube動画にアクセスして再生したら経験値を与える。
・個別の経験値はブラウザのキャッシュまたはCookieとして、ログイン不要で保存する。
・後でGitHub Pagesで公開する予定なので、Webページとして公開できるような言語仕様で作成する。
ーーーー
全ページに、下記のヘッダーを追加して。

・左側に、トップページに戻るアイコンを配置する。
・右側に、3つの学習要素のページに遷移する3つのボタンを配置する。
ーーーー
デザインが殺風景である。最先端のAIを学べるというワクワク感を出せるように、もっと配色やデザインをサイバーパンク風になるように工夫して。

Replit Agent向け

使用するプロンプト

職務経歴書の.docxファイルをアップロードしたら、そのファイルの内容を元に、アドバイスをしてくれるアプリを作りたい。UIは日本語で作成せよ。

GeminiのAPIを渡せる。

1画面に下記の機能をまとめよ。
・職務経歴書のdocxファイルアップロード機能
・ファイルの中身のテキスト分析機能
・分析結果と改善アドバイスのフィードバック機能
・アドバイスを盛り込んで改変された内容の.docxファイルの出力機能
ーーーー
下記のエラーが発生した。
分析中にエラーが発生しました: GEMINI_API_KEY環境変数が設定されていません

そもそもAPIの呼び出し方法は正しいのか?
下記の呼び出し例を元に考察し、必要なら別のモデルを要求せよ。
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash:generateContent?key=GEMINI_API_KEY"
-H 'Content-Type: application/json'
-X POST
-d '{
"contents": [{
"parts":[{"text": "Explain how AI works"}]
}]
}'
ーーーー

※下記はボツ案。

音声入力に対して音声を返すようなAIコンサルタントを作りたい。
Google GeminiのAPIキーを入力できる。これを活用せよ。

音声入力を行い、そこからネット上から拾ってきた情報を元に、アドバイスの音声を返すようなものを作成せよ。

不明な要件や仕様があれば都度確認せよ。

ーーーー
APIキーの保存はうまくいったが、その後のRecordingボタン部分を押して停止ボタンを押したところ、Conversationに下記のような表示が出現した。

Error processing audio: Audio file could not be read as PCM WAV, AIFF/AIFF-C, or Native FLAC; check if file is corrupted or in another format
ーーーー
下記のエラーが表示された。

申し訳ありませんが、リクエストの処理中にエラーが発生しました: 404 models/gemini-pro is not found for API version v1beta, or is not supported for generateContent. Call ListModels to see the list of available models and their supported methods.

そもそもこのモデルは音声を認識してテキスト化できるのか?
下記の呼び出し例を元に考察し、必要なら別のモデルを要求せよ。
curl "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash:generateContent?key=GEMINI_API_KEY"
-H 'Content-Type: application/json'
-X POST
-d '{
"contents": [{
"parts":[{"text": "Explain how AI works"}]
}]
}'
ーーーー
マイクの入力レベルを表示するインジケーターを作成して、音声入力の欄にリアルタイムに入力音量を反映するように表示して。

Accenture Japan (有志)

Discussion