AIが数十年の未解決問題を解く時代へ ── AlphaProof Nexusの衝撃

Google DeepMindが発表した「AlphaProof Nexus」が、数学の世界に静かな衝撃を与えています。数十年にわたり人間の数学者が解けなかった未解決問題を、AIが自律的に証明してしまったのです。しかも、1題あたりの推論コストはわずか数百ドル。今日はこのニュースについて、私なりに考えたことを書いてみたいと思います。

エルデシュ問題とは何か

ハンガリー出身の数学者ポール・エルデシュは、20世紀で最も多くの論文を発表した人物の一人です。彼は生涯にわたって数百の未解決問題を提唱し、その多くは賞金付きで公開されました。組合せ論、数論、グラフ理論など幅広い分野にまたがるこれらの問題は、数学者コミュニティにとって一種の挑戦状であり、何十年も解かれないまま残っているものが少なくありません。

AlphaProof Nexusは、このエルデシュの未解決問題353題に挑み、9題を自律的に証明しました。うち2題は56年間も未解決だったものです。さらに、整数列オンライン百科事典（OEIS）の未証明予想492題中44題も証明し、代数幾何学のヒルベルト関数に関する15年来の問題も解決しています。

仕組みの要点3つ

AlphaProof Nexusの仕組みで特に注目すべき点が3つあります。

1つ目は、形式証明言語「Lean」との組み合わせです。AIモデル（Gemini 3.1 Pro）が証明のステップを生成し、Leanコンパイラがそれを機械的に検証します。コンパイラのエラーメッセージがフィードバックとしてAIに返され、次の試行に活かされます。これにより、言語モデル単体の弱点である論理的推論のミスが補正される仕組みになっています。

2つ目は、4段階のエージェント構成です。最もシンプルなAgent (A)はLLMとコンパイラフィードバックだけで動作します。Agent (B)は強化学習ベースのAlphaProofに部分証明を委託でき、Agent (C)は進化的アルゴリズムで証明スケッチを共有・評価します。最も高度なAgent (D)はこれらすべてを統合したものです。

3つ目は、驚くべきことに最もシンプルなAgent (A)でも9題すべてを証明できたという点です。難しい問題ではコストが高くなるものの、LLMとコンパイラフィードバックという単純な組み合わせだけで成果が出ています。研究チームはこれを「特化型の学習済みシステムから、シンプルなエージェントループへの移行」と表現しています。

数学研究の新しい形

この成果で私が最も興味深いと感じたのは、「証明に失敗しても価値がある」という研究者の報告です。AlphaProof Nexusが生成した形式的な証明スケッチは、たとえ完全な証明に至らなくても、数学者が問題の構造をより深く理解する助けになったそうです。証明済みの部分はスキップして、未解決のサブゴールだけに集中できるからです。

つまり、AIは数学者を置き換えるのではなく、数学者の思考を加速させるツールとして機能し始めているわけです。量子光学やグラフ理論の研究で既に活用が進んでいるとのことで、実用段階に入りつつあります。

一方で、大半のエルデシュ問題は依然としてAIの手に負えず、「新しい理論の構築が必要な問題は論外」と研究者も認めています。数学の最前線にはまだ人間の直感と創造性が不可欠です。

まとめ

数百ドルの推論コストで数十年来の未解決問題を解くAI。これは単なる技術デモではなく、数学研究のあり方そのものが変わり始めているサインだと思います。人間が「何を問うべきか」を考え、AIが「証明の力仕事」を担う。そんな協働の形が、今まさに生まれつつあるのではないでしょうか。

📰 参考：https://the-decoder.com/google-deepminds-alphaproof-nexus-solves-decades-old-math-problems-for-a-few-hundred-dollars/

← ブログ一覧に戻る