Open7
生成AI周りのついて理解をする

生成AIに関する注意点
- 日本語は得意ではない。日本語よりも英語をが得意
- 同じ質問をしても同じ結果が返ってくるわけではない。
- 個人情報や機密事項を扱う場合は機密事項が保存をされないように注意をする。

生成AIの「できること・できないこと」を整理してみた
苦手なこと
正確な数値や統計データの提供は不向き
生成AIは「それらしい文章」を作るのが得意な一方で、正確なデータを提示する用途には向いていません。
例:売上実績や財務データのような数値確認には不向き
情報ソースが明記されないため、根拠を伴う資料作成には注意が必要です

生成AIはなぜ簡単な計算問題を間違えるのか。トークナイザーから見るLLMの計算プロセス

計算が苦手みたい。

いかが面白い
“最も確率が高い答え”を出す
杜氏はAIモデルが計算を誤る本質的な背景として、「LLMは数値計算をしているのではなく過去の学習データから最も確率が高い答えを当てようとしていると考えられる」とした。
実際に現代数学界の第一人者テレンス・タオ(Terence Tao)氏も同様の見解を示している。
They(AI models)’re not solving the problem from the first principles, they’re just guessing at each step of the output.(AIモデルは、最初に与えられた条件から問題を解いているのではなく、出力の各ステップを推測しているだけです。)
(「IMO2024:AIandMathematics」での発言より引用、訳は編集局による)

RAGとは

ARC-AGI-2
ARC-AGI-2は、2025年3月24日に発表された最新のAI評価指標で、従来のベンチマークとは一線を画す特徴を持っています。単なる記憶力や特定タスクの性能ではなく、本物の推論能力と抽象化能力を測定することを目的としています。