🧠

ChatGPT初級者向け、GPT-4Vを使ってみよう

2023/10/17に公開

ChatGPT

gpt4v

tech

目的

最近（というか、ここ半年以上）、ChatGPTや生成AIという言葉を見ない日はなく、私自身の仕事でも使うのが日常になっています。

そうなると、それが当たり前かと思っていたのですが、先日以前の会社の友人にあったら、「聞いたことはあるけど、使っていない」とか「会社で利用がNGになっている」のような話が大半でビックリしました。

ただ、最近出ている次のような記事を見ると、そちらが標準なのかなぁと思えてきました。

とはいえ、じゃあChatGPTなんて使わないでいいということはなく、使う人とそうでない人で大きな格差が出てきてしまうのではないかと思っています。（孫さんも言ってますが）

そこで、GPT-4に限らず、最近使えるようになったGPT-4VやDALL-E3などを含めて、こんな風に使うといいよ！というのを、数回に分けて実例を出してお話しできたらと思っています。

GPT-4Vって何？

GPT-4というのがChatGPTの最新バージョンで、大規模言語モデル（LLM：Large Language Model）の優秀さを見せつけてくれているものです。

GPT-4Vは、それが言語だけでなく大規模マルチモーダルモデル（LMM：Large Multimodal Model)として画像をもとに、生成AIを使うことができるようになっています。
今は画像だけですが、Multimodalなので、今後は音声とか動画とかも対応していくのでしょう。
（音声は出力だけは既にあるようです）

これらのサイトで、「これができる！」ということがまとまっているので、ぜひ見てみてください。（私の記事は、これの二番煎じですねｗ）

https://weel.co.jp/media/gpt-4v

検証結果

随時増やしていきたいですが、とりあえず５つほど。

23/11/4追加

まとめ

ぜひ、皆さんに知っていただきたいのは、「依頼の仕方を工夫する」必要があるということ。

これは、GPT-4Vに限ったことではないですが、ChatGPTを使っている人を見ても、多くがGoogle検索をするイメージで使っています。
もちろん、それでもいいのですが、検索して回答がでるものは、わざわざChatGPTに聞くまでもない内容です。それよりも、「出てきた結果をどう扱うか」を相談できる相手がChatGPTです。

そして、相談するとなると、こちらの課題感や疑問点、実施したいことの詳細をしっかり伝えることが重要ですよね。

それは、人に依頼するのと変わらないです。
ぜひ、その点を意識していただき、ChatGPTの活用をしていただけると幸いです。

目的

GPT-4Vって何？

検証結果

まとめ

Discussion