AIが自分自身を改良する日はいつ来るのか

最近、Import AIの最新号でJack Clark氏が「AI研究の自動化」について非常に踏み込んだ分析を発表しました。結論から言うと、2028年末までにAIが自律的に自分の後継モデルを訓練できるようになる確率は約60%とのことです。この数字、私はかなり衝撃を受けました。

急速に揃いつつあるピース

背景にあるのは、AIの能力が複数の領域で急激に向上しているという事実です。コーディング、科学実験の再現、カーネル最適化、さらにはAIモデル同士の管理まで、AI研究に必要なスキルのほぼすべてをAI自身がこなせるようになってきています。

特に象徴的なのがSWE-Benchの推移です。2023年末の登場時にはClaude 2が約2%しか解けなかった実世界のソフトウェア問題を、最新のClaude Mythos Previewは93.9%で解いています。METRの時間軸データも印象的で、AIが人間の代わりに信頼性50%で処理できるタスクの規模は、2022年の約30秒から2026年には約12時間まで拡大しているんですよね。

コーディング能力の飛躍的向上

AIのコーディング能力は完全に「実用段階」に入りました。SWE-Benchのスコア推移だけでなく、Anthropicが公開しているLLM学習最適化タスクでは、Claude Opus 4で2.9倍だった高速化がOpus 4.6で30倍、Mythos Previewでは52倍に達しています。フロンティアラボのエンジニアの大多数がすでにAIを通じてコーディングしているとのことで、現場の景色はすっかり変わってしまったようです。

AI研究そのものが自動化される

PostTrainBenchという興味深いベンチマークがあります。これはフロンティアモデルに小さなオープンウェイトモデルをファインチューニングさせ、人間の研究者が作ったチューニング版と比較するものです。2026年3月時点でAIシステムは人間の約半分の性能向上を達成しています。まだ人間には及びませんが、半分まで来ているというのは相当な進歩だと思います。

さらにAnthropicは、AIエージェントのチームにアライメント研究を自律的に行わせる実験も公開しています。人間が研究の方向性を示すと、AIが自分で手法を考え出し、人間の設計したベースラインを上回る結果を出したそうです。

AIがAIを管理する構造

もうひとつ見逃せないのが、AIが他のAIを管理するメタスキルの獲得です。Claude CodeやOpenCodeでは、ひとつのエージェントが複数のサブエージェントを監督し、ディレクター・批評家・エンジニアといった役割分担をAI同士で行いながら複雑なプロジェクトに並列で取り組んでいます。これはまさに「合成チーム」と呼ぶべき構造で、人間の研究チームと同じような分業が実現しつつあるわけです。

地道な汗仕事の自動化こそが本質

Clark氏の分析で私が最も重要だと感じたのは、「AIが天才的なひらめきを持てるか」よりも「99%の汗にあたる地道な作業を自動化できるか」が鍵だという指摘です。データの前処理、実験の実行、コードのデバッグ、パラメータの探索。AI研究の大部分はこうした「力仕事」で構成されていて、公開データを見る限り、AIはすでにその大半を処理できるレベルに達しています。

ただし、深刻な課題もあります。再帰的な自己改善ループでは、アライメント技術が99.9%の精度であっても500世代後には60.5%まで劣化する可能性がある。また、資本集約型で人間の労働力が軽い「マシンエコノミー」の形成は、格差や再分配に関する根本的な問いを突きつけます。

まとめ

2028年という時間軸は、遠いようで意外と近いと思います。OpenAIは2026年9月までに「自動化されたAI研究インターン」の構築を目標に掲げ、Anthropicは自動化されたアライメント研究者の開発を公開し、数百億ドル規模の資本が「AI研究の自動化」に向けて投入されています。

私は、この変化の本質は「地味な汗仕事の自動化だけでも、十分に大きな変化が起きる」という点にあると考えています。すべてのピースが揃いつつある今、技術の進歩を見守りながら、社会としての備えを真剣に議論していく必要があるのではないでしょうか。

元記事: https://jack-clark.net/2026/05/04/import-ai-455-automating-ai-research/

📰 参考：https://jack-clark.net/2026/05/04/import-ai-455-automating-ai-research/

← ブログ一覧に戻る