🍣
GPT-4oには様々な言語に関するテーマが含まれている
2024年5月13日、OpenAIは次世代の人工知能モデルである「GPT-4o」を発表しました。GPT-4oは、音声、視覚、テキストの入力を同時に処理し、リアルタイムに理解して推論する能力を備えています。
この発表は「Spring Update」と呼ばれるイベントの一環で行われました。このイベントでは、GPT-4oの紹介に加え、他の新機能やアップデートも発表されました。
「GPT-4o」という名称には意味がこめられています。「o」は「omni」、つまり「全能」を表しています。つまり、GPT-4oは、より自然で人間に近いヒトとコンピューターのインタラクションを目指して設計されたモデルなのです。
ただし、一部の研究者やユーザーからGPT-4oの欠点も指摘されています。香港在住の研究者、ヘンリー・ルオが投稿した興味深い英語のブログ記事がある。ヘンリー・ルオは、GPT-4oの新しいトークナイザーo200k_baseが、多くの言語に対して偏見を持っていると述べていました。彼は、10カ国の言語について、それぞれ100個の最長トークンを分析しました。
日本語では、「礼節」「感謝の気持ち」「匿名性」などのテーマが顕著に見られました。ロシア語では「ガバナンス」「法制化」「国家の問題」、中国語では「アダルトコンテンツ」「ギャンブル」「偏った広告」、韓国語では「思いやり」「ビジネス」「オンラインサービス」などのテーマが見出されたとのことです。
こちらにニュースレポートがあります。
こちらに元の英語のブログがあります。
Discussion