Open9
visual-chatgptをGoogle Colabで試す
![kurehajime](https://res.cloudinary.com/zenn/image/fetch/s--9YRH98sq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_70/https://storage.googleapis.com/zenn-user-upload/avatar/d610511011.jpeg)
Microsoftが公開したチャットしながら画像を生成できるvisual-chatgpt、今のところではGoogle Colabではすんなり動かない。
なので有志が切り開いてくれた回避策の方を試してみる。
今回は本家ではなくこっちのfork版を使う。
![kurehajime](https://res.cloudinary.com/zenn/image/fetch/s--9YRH98sq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_70/https://storage.googleapis.com/zenn-user-upload/avatar/d610511011.jpeg)
まずOpenAIのシークレットキーを読み込む
from getpass import getpass
secret = getpass('Enter the secret value: ')
import os
os.environ["OPENAI_API_KEY"] = secret
![kurehajime](https://res.cloudinary.com/zenn/image/fetch/s--9YRH98sq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_70/https://storage.googleapis.com/zenn-user-upload/avatar/d610511011.jpeg)
でもってrupeshs
さんのforkをクローン。
!git clone https://github.com/rupeshs/visual-chatgpt.git
![kurehajime](https://res.cloudinary.com/zenn/image/fetch/s--9YRH98sq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_70/https://storage.googleapis.com/zenn-user-upload/avatar/d610511011.jpeg)
カレントディレクトリを移動して、ブランチを切り替える。
%cd visual-chatgpt/
!git checkout add-colab-support
![kurehajime](https://res.cloudinary.com/zenn/image/fetch/s--9YRH98sq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_70/https://storage.googleapis.com/zenn-user-upload/avatar/d610511011.jpeg)
rupeshs
さんが作ったrequirements-colab.txt
の方をpip installする。
本家版はGoogle Colabで動かすといろいろ失敗する。
!pip install -r requirements-colab.txt
![kurehajime](https://res.cloudinary.com/zenn/image/fetch/s--9YRH98sq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_70/https://storage.googleapis.com/zenn-user-upload/avatar/d610511011.jpeg)
imageフォルダを作ってdownload.sh
を実行。これは本家と同じ手順。
!mkdir ./image
!chmod +x download.sh
!./download.sh
![kurehajime](https://res.cloudinary.com/zenn/image/fetch/s--9YRH98sq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_70/https://storage.googleapis.com/zenn-user-upload/avatar/d610511011.jpeg)
そんでvisual_chatgptを起動。
!python visual_chatgpt.py --share
Running on public URL: https://なんとかかんとか.gradio.live
というように、gradioのURLが表示されるので、それをクリック。
するとvisual_chatgptで遊べるようになる。
![kurehajime](https://res.cloudinary.com/zenn/image/fetch/s--9YRH98sq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_70/https://storage.googleapis.com/zenn-user-upload/avatar/d610511011.jpeg)
精度は微妙。
日本語でお願いしても英語でお願いしても、あまり複雑なことはできない。
![kurehajime](https://res.cloudinary.com/zenn/image/fetch/s--9YRH98sq--/c_limit%2Cf_auto%2Cfl_progressive%2Cq_auto%2Cw_70/https://storage.googleapis.com/zenn-user-upload/avatar/d610511011.jpeg)
来週出てくると噂されているGPT-4はこういうことができると言われてるから、あくまで「GPT-4ごっこ」を先取りできる感じかな。
やりたいことは伝わった。