👌

グーグルとOpenAIの発言は、AI戦争の新たな局面を示唆している

2024/05/17に公開

本記事は、Fastcompanyにより翻訳されたものです。
https://www.fastcompany.com/91125885/google-openai-chatbot-wars

つい昨年、大手ハイテク企業は、自社の大規模言語モデル(LLM)が文書を要約したり詩を書いたりできることがいかに素晴らしいかを語っていました。AIの売り込みははるかに面白くなっています。今週、AIチャットボット競争の2大プレーヤーであるグーグルとOpenAIは、より重い問題に取り組むAIチャットボットを実演しました。では、これらのチャットボットを動かすAIモデルは、この1年で具体的にどのように変化したのでしょうか?

今、主要モデルは 「マルチモーダル 」になっています。テキストだけでなく、音声、画像、コンピューターコードを理解・分析し、同じ媒体で回答を作成することができます。簡単な例では、OpenAIのChatGPTやグーグルのGeminiは、(おそらくスマートフォンのカメラを通して)視覚画像を取り込み、その画像の内容を言葉で説明することができます。「マルチモーダリティは、私たちが尋ねることができる質問の種類と、私たちが返すことができる答えを根本的に拡張します」と、GoogleのCEOであるSundar Pichaiは、同社のI/Oイベントで述べています。

月曜日、OpenAIは新しいGPT-4oモデル(「o 」は 「omni 」の略)を搭載したChatGPTのアップグレード版をデモしました。新しいChatGPTの最も顕著な点は、チャットボットとの対話が 「人間的 」に感じられることです。それは主に、ChatGPTの彼女のような話し声の音と動作によるものです。その口調は奇妙なほど人間的で、自然で表情豊かに聞こえ、文脈によっては拗ねたような、少し軽薄な感じさえします。さらに、冗談をするもできます。ユーザーが話し始めるのを聞くと、すぐに話すのをやめます。音声は、モデルが理解するテキストやビジュアルのモードと同じように、もう一つの 「モード 」を表しています。そしてChatGPTはさらにもう一つのモード、感情知能(EQ)を追加しました。ユーザーの声に含まれる感情を検出し(月曜日のデモでは、チャットボットはOpenAIの研究者の声に含まれるストレスを検出しました)、適切な感情(研究者にとっては共感)で返答に影響を与えることができるようです。グーグルは同様の音声対話チャットボット「Geminiライブ」を今年後半にリリースする予定です。

さらに重要なのは、AIモデルがこれらのマルチモーダル入力について「推論」する能力を開発したことです。例えば、グーグルはI/Oで、Geminiチャットボットがユーザーの旅行計画を支援する方法を実演しました。Geminiはまず、ユーザーのGmailにあるEメールの予約から旅行のロジスティクス(フライト、ホテルなど)を抽出し、次に、ユーザーの興味に関する情報を収集した後、(Googleマップのデータに基づく)ユーザーのホテルとの相対的な位置関係から、利用可能な時間内に最適なアクティビティを決定します。

ChatGPTとGeminiはそれぞれのデモで、ホワイトボードに書かれた数学の問題を見せられ、それを解く手助けを求められました。 両社とも、例えばチャットボットがスクリーンからコンピューター・コードを読み取って分析するデモを行いました。実際、コンピューター・コードは、これらのAIモデルがどのように推論し判断する能力を獲得しつつあるのかを理解する鍵となるかもしれません。

グーグルのGemini担当副社長兼ジェネラル・マネージャーのセシリア・ショーは、月曜日のFastcompanyのインタビューで、「コードを使ってモデルを訓練したところ、推論や数学が得意になることがわかりました。このモデルに詩だけでなく、コードのような構造や科学的推論を内包するものを教えることで、推論能力が現れるようです。」

振り返れば、消費者向けのAIチャットボットがより感覚的で合理的になり、さらには感情的な知性を獲得した時期として認識されることになるでしょう。私たちのAI助手はまだ未完成ですが、明らかに胎動期を脱しつつあります。

以上、AI戦争の新たな局面についてを紹介しました。最新のAIトレンドやAI製品に関心を持つ方に、AI超解像技術を搭載することによって手仕事をできるだけ少なくにし、ワンクリックで写真のモザイク除去を実現できるVanceAIシリーズのVanceAIぼかし除去や、写真をアップロードするだけで、AIが自動的にその写真を8倍まで拡大しながら写真を高解像度化するVanceAI高解像度化を試すのをお勧めします。

Discussion