🍣

GPT-4oには様々な言語に関するテーマが含まれている

2024/05/31に公開

2024年5月13日、OpenAIは次世代の人工知能モデルである「GPT-4o」を発表しました。GPT-4oは、音声、視覚、テキストの入力を同時に処理し、リアルタイムに理解して推論する能力を備えています。

この発表は「Spring Update」と呼ばれるイベントの一環で行われました。このイベントでは、GPT-4oの紹介に加え、他の新機能やアップデートも発表されました。

「GPT-4o」という名称には意味がこめられています。「o」は「omni」、つまり「全能」を表しています。つまり、GPT-4oは、より自然で人間に近いヒトとコンピューターのインタラクションを目指して設計されたモデルなのです。

ただし、一部の研究者やユーザーからGPT-4oの欠点も指摘されています。香港在住の研究者、ヘンリー・ルオが投稿した興味深い英語のブログ記事がある。ヘンリー・ルオは、GPT-4oの新しいトークナイザーo200k_baseが、多くの言語に対して偏見を持っていると述べていました。彼は、10カ国の言語について、それぞれ100個の最長トークンを分析しました。

日本語では、「礼節」「感謝の気持ち」「匿名性」などのテーマが顕著に見られました。ロシア語では「ガバナンス」「法制化」「国家の問題」、中国語では「アダルトコンテンツ」「ギャンブル」「偏った広告」、韓国語では「思いやり」「ビジネス」「オンラインサービス」などのテーマが見出されたとのことです。

こちらにニュースレポートがあります。
https://www.technologyreview.jp/s/337128/openais-latest-blunder-shows-the-challenges-facing-chinese-ai-models/

こちらに元の英語のブログがあります。
https://medium.com/@henryhengluo/bias-alignment-atypical-stereotypical-nationality-analysis-7ffbef9ee967

Discussion