🛣️

【AIで画像入力】Google Bardを試してみた

2023/07/18に公開

先日、こんな記事を見かけました。

チャットAIで画像入力が可能に。ChatGPTより一足早くやってきたGoogle Bardマルチモーダルの使い方(Google特別対策室)

https://www.techno-edge.net/article/2023/07/17/1602.html

AIで画像生成系はよく見るけど、
「チャットAI」で画像入力とは、、?なんぞや?

https://bard.google.com/updates

Google Lens in Bard

  • What: You can upload images alongside text in your conversations with Bard, allowing you to boost your imagination and creativity in completely new ways. To make this happen, we’re bringing the power of Google Lens into Bard, starting with English.
  • Why: Images are a fundamental part of how we put our imaginations to work, so we’ve added Google Lens to Bard. Whether you want more information about an image or need inspiration for a funny caption, you now have even more ways to explore and create with Bard.

Google Bard とは?

https://bard.google.com/

Bard へようこそ: 創造力や生産性を高める AI パートナーとして、あなたをサポートします。

Bard は試験運用中のサービスであるため、生成される回答は不正確または不適切な場合があります。フィードバックをお送りいただくと、機能の改善に役立ちます。

Google検索と連動して回答してくれるAIです。
わたしはGoogle Chromeをメインブラウザとして利用しているので、
同じ検索エンジンから回答を得られるのは嬉しいですね🐰

Bardを使えるようにする

Bardを利用したことがないため、まずは利用登録からです。

試運転中のサービスなのですね!
規約に同意して、進めます。

ログインはできましたが、画像入力をおこなえません。
それもそのはず、「画像入力」機能は英語版でしか使えないのです!

Googleアカウントの言語設定を英語にすればOKです🌝
※変更する言語設定はブラウザではなく、Googleアカウントですよ!!

試してみた

英語版で再度Bardを表示してみると、
文字入力の左側に「+」アイコンが追加されていました!

さっそく、家で飼ってる猫の写真を貼り付けてみます。

(名前は こてつ といいます🐈 男の子です)

英語分からないのでスゴイ冷たく送信してしまいましたw
Bardちゃん、少し考えていますね(体感5秒ぐらいです)

あなたが送った画像には、テーブルの下に座っているグレーと白の猫が写っています。猫は前足を床に置き、後ろ足を体の下に押し込んで正座しています。猫の尻尾は体に巻き付いています。猫は緑色の目でカメラを見上げています。テーブルは木製で、白いテーブルクロスがかかっています。テーブルの上の鉢に植物が入っています。画像の背景は白く塗られた壁です。

画像に関して言いたいことは次のとおりです。

- 猫がテーブルの下に座っているのは、安心感があるからです。
- 猫の座り姿勢は、リラックスしていて快適であることを示しています。
- 猫の緑色の目は美しく、表情豊かです。
- テーブルと鉢植えの植物が全体の雰囲気を引き締めます。
- 白い背景は猫を際立たせ、猫の特徴を際立たせます。
これがお役に立てば幸いです!

日本語翻訳してみました。
所々異なる箇所はありますが、結構あっています👀
す、すごい、、

  • 身体の色(二色を識別!)
  • 瞳の色
  • 姿勢
  • 壁の色?

これだけの情報を読み込んでくれました。
また、回答した内容を読み上げてくれる機能もあることに驚きです!

動物はいけそうなので、別の画像も行ってみましょう、、、
先日焼肉に行ったので、焼く前の牛タンを送信してみました。

これも日本語翻訳してみます。

画像のお肉は牛肉です。具体的には、焼き肉、牛タンのいずれかです。

焼肉は、通常、薄くスライスした牛肉、豚肉、または鶏肉で構成される日本のグリル料理です。肉は熱いグリルでグリルされ、さまざまなソースやサイドディッシュと一緒に提供されます。牛タンは日本料理でよく使われる牛肉の一種です。硬い肉の部位で、通常は煮込んだりグリルしたりして調理されます。

画像の肉は薄切りでほんのりピンク色をしており、焼肉か牛タンのどちらかだと思われます。肉の食感からも牛タンと同様に硬い部位であることがわかります。

しかし、詳しい情報がなければ、それがどのような肉であるかを正確に言うことは困難です。たとえば、画像が撮影された地域がわかれば、可能性を絞り込むことができるかもしれません。たとえば、日本では牛タンよりも焼き肉の方が人気があるため、日本で撮影された画像であれば焼き肉である可能性が高くなります。

全体的に画像の肉は牛肉である可能性が高く、焼肉か牛タンの可能性があります。

牛タンであることを認識している…だと…!?

「これは肉です」ぐらいの回答かと思いましたが、
お肉の種類まで当てられるのですね!?

では、ちょっと難しい問題を出します(楽しくなってきた)

これは愛知県にある(大好きな)ラーメン屋で撮影した写真です。
https://tsurukamedo.jp/

豚骨ラーメンなのですが、このラーメンが
「何味のラーメンなのか」を判別することはできるのでしょうか、、?

画像のラーメンはおそらく醤油ラーメンでしょう。醤油ラーメンは、醤油ベースのスープ、鶏または豚、ネギ、海苔、メンマなどのトッピングで作られた日本の麺のスープです。画像は醤油ラーメンらしい淡い色のスープです。ネギや海苔も醤油ラーメンの定番トッピングです。

画像には醤油ラーメンにはあまり入っていない豆もやしも入っています。ただし、豆もやしは、味噌ラーメンやとんこつラーメンなど、他の種類のラーメンにもよく使われます。ということは、画像のラーメンは醤油ラーメンと他のラーメンのハイブリッドである可能性があります。

結局のところ、より多くの情報がなければ、画像にあるラーメンがどのようなものであるかを確実に言うことは困難です。しかし、目に見える具材から判断すると、おそらく醤油ラーメンであると思われます。

答えは外れましたが、「肉」「ネギ」「海苔」を画像から読み取ることができています!

では、最後にもうひとつ!

先日名古屋ビルヂングで撮影した写真です。
名古屋駅のシンボルとも言える以下のビルが一望できますね。

  • ゲートタワー
  • JPタワー
  • 奥にルーセントタワーがちょっとだけ
  • 右端に大名古屋ビルヂングがちらり

画像の場所は名古屋のJRゲートタワーです。名古屋駅の真上に位置する高さ240メートルの超高層ビルです。名古屋マリオットアソシアホテルやJRゲートタワーホテルなど、多くの企業が入居するビルです。観光地としても人気があり、建物の上からの景色を眺めるために多くの人が訪れます。

お送りいただいた画像はJRゲートタワーを東側から見たものです。建物の周囲にはJRセントラルタワーズや名古屋市役所などの高層ビルが建ち並んでいます。この画像には遠くに名古屋のスカイラインも見えます。

これがお役に立てば幸いです!

一番手前にあるビルの名前をピタリと言い当てることができました!
しかもこの写真、SNSなどにも掲載していないので完全ローカルな画像です、、、

全く新しい写真から地名を言い当てられるのって、
すごいですね🤔🤔🤔

普段なにげなく街を歩いたりしているときに
気になる情報を写真撮影しておいて、

あとでGoogle Bardで調べる、、なんてこともできそうですね!
その他にも色々使い方を探れそうです。

日本版の普及が待ち遠しいですね🥰
みなさんもぜひ、英語版で試してみてください~✨

コラボスタイル Developers

Discussion