AIが60年未解決の数学問題を解いた話で、本当に怖いのは「答え」じゃない

正直、最初にこの話を見たときは「またAIすごい系の話か」と思った。
でも少し追うと、これは単なるバズでは済ませにくい。
60年ほど未解決だったエルデシュの問題が、GPT-5.4 Proの助けを借りて解かれた。
しかもテーマは、primitive set、つまり「集合の中のある数が、別の数を割り切らないような整数の集まり」に関するかなり硬い数学の話だ。
普通に生活していたら、まず出会わない種類の問題。
でもここで起きたことは、開発者にもかなり近い。
これは「計算が速いAI」の話ではない
今回のポイントは、AIが大量計算でゴリ押ししたことではない。
むしろ面白いのは、別の分野の考え方を持ち込んで、証明の道筋を作ったところにある。
数学の証明って、ざっくり言えば「絶対に崩れない説明書」を作る作業だ。
料理で言えば、完成品の写真を出すだけでは足りなくて、誰が同じ手順で作っても同じ味になるレシピまで書く必要がある。
AIがやったとされているのは、まさにそのレシピ作りに近い。
「この材料をこう並べると、最後にちゃんと目的地へ着く」という論理の道を作った。
これまでのAIは、どちらかというと「知っていることをうまく出す」存在だった。
でも今回は、少なくとも見た目としては、人間が見落としていた入口を見つけたように見える。
AIが数学で強くなるというのは、計算機が速くなる話ではなく、「問いへの入り口」が増える話だと思う。
ここが地味に大きい。
なぜ今、この話が重いのか
半年前なら、ここまで騒がれなかったと思う。
理由はシンプルで、AIの数学能力は長い間「それっぽいが間違う」ものとして見られていたからだ。
数学では、雰囲気の良い文章に価値はない。
一行でも論理が崩れたら終わり。
これはコードにも似ている。
READMEが美しくても、本番で決済処理が壊れたらアウト。
数学の証明は、それよりさらに厳しい世界だ。
だから今回の話は、「AIが賢そうな文章を書いた」ではなく、人間が検証できる形の候補を出して、専門家コミュニティが議論できる土俵に乗せたところに意味がある。
もちろん、ここは慎重に見るべきだ。
AIが出した証明が、すぐに「完全に歴史的成果」と確定するわけではない。
査読、形式検証、専門家によるチェックは別物だ。
ただ、それでも空気は変わった。
「AIに数学を解かせるなんて無理でしょ」から、「どの問題ならAIと一緒に攻められるか」に問いが変わってきた。
開発者にとっては、これは未来のコーディングの話でもある
個人的には、ここが一番おいしい。
数学の証明とコードは、かなり似ている。
どちらも、なんとなく良さそうでは足りない。
入力があり、制約があり、例外があり、最後に破綻しない構造が必要になる。
だからAIが数学で「探索して、仮説を立てて、検証可能な形にする」方向へ進むなら、AI駆動開発も同じ方向へ進む。
今のCursorやClaude Code、GitHub Copilotは、すでに実装の相棒としてかなり強い。
でも次の段階では、単にコードを書くのではなく、設計上の行き止まりを見つけ、別ルートを提案し、検証方法まで一緒に出す存在になっていく。
たとえば個人開発で、課金設計、キャッシュ戦略、推薦ロジック、DB設計に詰まったとする。
そこで「この要件で実装して」ではなく、こう聞く。
「この制約下で、破綻しにくい設計を3案出して。各案について、失敗するケースと検証方法も出して」
この聞き方に変えるだけで、AIは単なる作業者ではなくなる。
少し大げさに言えば、小さな研究相棒になる。
3年後、たぶん笑われるのは「AIに答えだけ聞いていた時代」
今回の話で一番大事なのは、「AIが数学者を置き換える」ではないと思う。
むしろ逆で、良い問いを立てられる人の価値が上がる。
AIが強くなるほど、人間側に残る仕事はこう変わる。
何を問うか。
どの制約を入れるか。
出てきた答えのどこを疑うか。
どの検証を通せば、安心して前に進めるか。
これは開発でも同じだ。
明日から試すなら、いま抱えている一番面倒な技術課題を、いつもの「実装して」ではなく、こう投げるといい。
「この問題を、別分野の発想を使って解くならどうなる? その案が間違っている可能性も含めて、検証手順まで出して」
正直、全部は当たらない。
むしろ外すことも多い。
でも、1つでも人間が思いつかなかった補助線が出たら、それだけで価値がある。
今回のErdős問題の話は、AIが答えを出す時代というより、人間がひとりで考える範囲が急に狭く見え始めた時代のサインなんじゃないかな。
#AI駆動開発 #GPT54Pro #数学 #個人開発 #生成AI
Discussion