visual-chatgptをGoogle Colabで試す

Microsoftが公開したチャットしながら画像を生成できるvisual-chatgpt、今のところではGoogle Colabではすんなり動かない。
なので有志が切り開いてくれた回避策の方を試してみる。

まずOpenAIのシークレットキーを読み込む

from getpass import getpass
secret = getpass('Enter the secret value: ')
import os
os.environ["OPENAI_API_KEY"] = secret

でもってrupeshsさんのforkをクローン。

!git clone https://github.com/rupeshs/visual-chatgpt.git

カレントディレクトリを移動して、ブランチを切り替える。

%cd visual-chatgpt/
!git checkout add-colab-support

rupeshsさんが作ったrequirements-colab.txtの方をpip installする。
本家版はGoogle Colabで動かすといろいろ失敗する。

!pip install -r requirements-colab.txt

imageフォルダを作ってdownload.shを実行。これは本家と同じ手順。

!mkdir ./image
!chmod +x download.sh
!./download.sh

そんでvisual_chatgptを起動。

!python visual_chatgpt.py --share

Running on public URL: https://なんとかかんとか.gradio.liveというように、gradioのURLが表示されるので、それをクリック。
するとvisual_chatgptで遊べるようになる。

精度は微妙。
日本語でお願いしても英語でお願いしても、あまり複雑なことはできない。

来週出てくると噂されているGPT-4はこういうことができると言われてるから、あくまで「GPT-4ごっこ」を先取りできる感じかな。
やりたいことは伝わった。