📕

なぜ、LLM AIは競馬に関する質問回答が苦手なのか?

に公開

はじめに

LLM AIは世界史や哲学のような構造化された文章領域には強い一方で、競馬という領域では血統表、馬柱、競馬史のいずれについても正確な回答を行えません。この差は単なるデータ量の問題ではなく、競馬のデータが持つ非構造性表形式依存更新頻度の高さなどの特性が、LLMの設計思想と根本的に噛み合わないことに由来します。本レポートでは、競馬がLLMにとってなぜ極端に不適合な領域となるのかを、技術的観点から体系的に整理します。また、別の例として知られる将棋のケースと比較しながら、共通する弱点構造についても一つのレポート内で論理的にまとめます。

競馬データは非構造的である

競馬の根幹にある血統表や馬柱は、人間の目には読み物のように映りますが、内部では木構造横方向依存略号体系が複雑に絡んだ高度に非線形な情報群です。LLMは文章の線形性を前提に学習するため、このような階層構造や並列構造の整合性を維持する処理を苦手とします。さらに、媒体ごとの差異や書式の揺らぎが大きく、同じ馬の情報であっても統一した表現形式が存在しないため、学習段階で有効な一般化が成立しません。その結果、血統表の取り違えや構造破綻が頻繁に生じます。

名前の類似と同名問題

競馬界では、語形の類似性同名馬の存在世代ごとの名前再利用などが日常的に発生します。LLMは確率的言語処理の性質上、似たトークン同士の区別を誤りやすく、識別子としての馬名を正しく扱うことが困難です。サンデー系のような語感の近さや、異国間での同名馬の混在は、LLMにとって高確率で誤マッチを誘発する要素です。このため、父母の取り違え、血統表の世代崩れ、別馬の戦績混同などが容易に起こります。こうしたトークン競合は競馬データ特有の強烈な難所です。

数字・略号・表形式への根本的な弱さ

馬柱や競走成績は、数字位置依存略号で意味が決まる明確な表形式データです。これは文章のように文脈依存で推論する対象ではなく、座標と記号の正確な解釈を必要とする情報形式です。LLMは表の座標的意味を理解する能力を持たないため、馬柱の読み取り、略号の識別、時系列の比較などにおいて構造崩壊が生じます。また、媒体ごとに略号体系や配置が異なるため、表の意味が安定せず、統計モデルが繰り返し学習しても正しいパターンを形成できません。この弱点が競馬における致命的な誤答へ直結します。

更新頻度と鮮度差の激しさ

競馬は、毎週発生する結果更新登録馬の急速な入れ替わり世代交代によって常に情報が変化する領域です。LLMは学習後の内部知識を継続的に更新できないため、古いデータと新しいデータが混ざり、不整合や時制の錯誤が起こりやすくなります。特に世代交代が早い競走馬界では、同じ名前を見ても時期を間違える誤解が発生しやすい構造が存在し、更新速度の速さと非標準的な記録体系がLLMの弱点を増幅させます。

競馬史は文化であり標準化されていない

世界史や哲学のような分野は、因果構造標準化された記述明確な章構成といったLLMが得意とする特性を備えています。対照的に競馬史は、記者の書き方、地域差、逸話、伝統、感覚的表現が混ざり合う文化的データであり、標準化がほとんど行われていません。競馬史に関する文章は、叙述の統一性が欠け、事実と感情表現が混在するため、一貫した構造として学習されません。このため、競馬史そのものの整理もLLMにとって困難になります。

人間の雑データ補正能力との構造差

人間は競馬新聞に含まれるゆらぎを脳内で自動補正します。書式の揺れや誤植、略号の解釈、位置ズレ、語感の類似などを無意識に整形し、一貫した意味に変換します。この補正能力はLLMには存在しません。LLMは入力されたデータをそのまま統計処理するため、崩れたデータが崩れた答えに直結し、特に競馬のようなノイズが多い領域では破綻が顕著になります。人間の強さとLLMの弱さの差が最も露骨に表れる領域の一つが競馬です。

まとめ

LLM AIが競馬に関する質問回答全般に弱い理由は、競馬という領域が構造の非適合という本質的問題を抱えているためです。血統表の木構造、馬柱の表構造、名前の類似性、記録体系の非標準性、情報更新の早さ、人間による補正依存、文化的ゆらぎなど、競馬が持つ特徴はLLMの設計思想と根本的に噛み合いません。また、将棋のように構造そのものが意味を形成する領域では、テキスト処理の枠組みでは性能が発揮しにくく、競馬もその典型例です。競馬をAIで正しく扱うためには、言語モデルではなく、表形式データや時系列データを直接扱う専用の機械学習モデルを用いる必要があり、LLMはその設計上の理由から不向きであると結論づけられます。

Discussion