manus / gensparkでスライド生成

スライド作成をAIにやらせたい。いい感じにやれないかなーということで記事をスライドに変換する処理をmanus / gensparkで試してみる。
対象記事はこちら

なんでgenspark?と思ったでしょうが。
後輩がいい感じのスライドをgensparkで作ってたので試してみることに

promptは全く同じものを使うことに。
以下の指示に基づいてプレゼンテーションスライドを作成してください:
これから一緒にスライドを作ります。htmlを使い16:9にしましょう。
添付画像は記事内に含む画像です。3枚目は背景画像に使ってほしいものです。
表現方法は任せますが、具体の内容は変えず、図解なども足してOKです。ではまずは製作の戦略・方針を立ててください
【本文】
<title>AI選びの混乱が5分で解ける基盤モデルとAIツールの関係【今から学ぶ人向け】</title>
<body>
こんにちは、shuzonです。
今回は「AIツール」をより深く理解するために、基盤モデルとツールを分けて捉える方法についてお伝えします。
AIツールたくさん乱立してなかなか理解が難しいですよね。今回は その「AIツール」をより解像度高く理解できるように書いていきます。
きっとこの記事を読んだ後は「AIツール」を2つに分けて捉えられるようになると思います!
基盤モデル
それを利用したツール
では早速見ていきましょう。
AIの世界は、実は2層構造
画像
2層構造の例
1. 頭脳部分(基盤モデル)
Anthropic Claude
OpenAI GPT
Google Gemini
...
これらが「基盤モデル」と呼ばれる、AIの頭脳そのものです。
LLM(Large Language Model / 大規模言語モデル)とも呼ばれます。
すごく賢いけど、そのままでは汎用的すぎてシーンや用途に特化して使うためにはカスタマイズが必要になります。
2. 頭脳を活かして専門化したツール
同じ頭脳(基盤モデル)を使っても、専門化の方向で全く違うツールになります。
人に例えるなら、「優秀な人」と一言にいってもでも「営業」「企画」「エンジニア」などの専門性によって発揮する具体的な能力が変わるようなものですね。
Cursor → プログラミングに特化
NotebookLM → 文書/音声を大量に保持した分析・壁打ちに特化
Dify → AIを使ったワークフロー開発に特化
具体的にどういうことか
たとえば、CursorというAIエージェントを使ったプログラミングエディタ。
これはプログラミングに特化したエディタとして開発されています。
その上で、主にClaude/GPT/Gemini など様々な基盤モデルを利用可能です。
コードを書く時の文脈を理解する機能
ファイル全体を把握する機能
エラーを素早く修正する機能
コーディング機能
コマンドを実行し実際に開発を行う機能
Claudeを使っていたとして、頭脳としては同じものを使っているのですが、普通のチャットで使うのとは全然違う体験になります。
何が言えるのか
「どのAIが最強か」という質問は的外れ
基盤モデル(頭脳)の優劣より、用途に合ったツール選びが重要
その上で、どのツールを使うかを選ぶのが大事
複数のツールを使い分けるのが賢い選択
Claude / GPT / Gemini など、基盤モデルを直に使うのも良い
基盤モデルのそれぞれの得意分野を活かし、用途ごとに相性の良いツールを見つける
文章はClaude、コードはCursor + Claude、ワークフローはDify + GPTのように用途ごとに相性の良い組み合わせを見つける
まとめ
AIツールを理解する上で重要なのは、「頭脳(基盤モデル)」と「専門化されたツール」の関係性を把握することです。
基盤モデル
具体例: Claude、GPT、Gemini
優秀な頭脳そのものですが、汎用モデルなため、そのままでは特定の用途に最適化されていない
専門化されたツール
具体例: Cursor、NotebookLM、Dify
優秀な基盤モデル(頭脳)を特定の分野に特化させることで、その分野での圧倒的な能力を発揮
つまり、「どのAIが最強か」ではなく、「自分の用途に最適な組み合わせは何か」を考えることが重要です。複数のツールを使い分け、それぞれの得意分野を活かすことで、AIの真の力を引き出すことができるのです。
メンバーシップをやっています。AI仕事術に詳しくなりたい人は是非!
</body>

manus一撃でこれ出てきた...私が渡した画像を背景画像として使っているのでアレだけど、背景画像差し替えたら普通に行けそうな内容出してきてる
生成されたファイルを一括で扱えるダイアログ
どうやら裏側でtodoを作りそれを実行しながら更新してるっぽい
お、これが噂のgoogle slide変換機能。
OIDC通したらまじでgoogle slideになったな
ほんのちょっと修正するだけでこんな感じ
- スライド背景の変更
- 文字や背景・場所の調整
普通に雑な資料ならまじでこれでいいな。

え?直編集できるのこれ?
と思ったらHTML domをpreview / editから直で書き換えるのは出来ないっぽい。
同じHTMLファイルでスライドを連続して扱おうとするとこうなるっぽい。manus独特の縛りのよう。
つまりgoogle slideに出力するかmanus上でいじるかを迫られるっぽいなぁ。

D&Dで直接位置をいじるとかはできないっぽいな
なんかいい感じにはできるけど、自由度は低めなのが HTML生成
convert後の品質は微妙だけど後から編集しやすいのがgoogle slideって感じか

html to figmaを使ってみよう
これを有効にしないとローカルファイルへのアクセスが出来ないので注意

実行するとこんな感じでjsonがDLされる
figma側のプラグインでjsonを読み込む
うーん特段何も出てこないな

gensparkにも同様のプロンプトで生成をお願いしていた。
質はひどいものだが...
genspark 側は html to figmaでうまく読み込まれるな
なんか成果物のhtmlで独自のものがあり、それが邪魔しているんだろうか

gensparkはクレジットが切れてしまった

まぁ細かいことはさておき、ズバッと作ったものをgoogle slideに持ち込めるmanusのほうが一歩リードかなぁ

gensparkは課金するほど試したいわけでもないのでclose

manus箱の調査で600クレジット使ったしコスパは全然良くなさそう