LLMの進化が止まらない — この半年で何が変わったのか

この半年間でLLM（大規模言語モデル）の世界は劇的に変わりました。先日、PyCon US 2026でSimon Willison氏が「この半年間のLLMの進化を5分でまとめる」というライトニングトークを行い、その内容がブログ記事として公開されました。今日はその内容をもとに、2025年末から2026年にかけてLLMの世界で何が起きたのかを整理してみたいと思います。

2025年11月 — 変曲点が訪れた

Willison氏が特に強調していたのが「2025年11月の変曲点」です。この月だけで「最強モデル」の称号が5回も入れ替わりました。Claude Sonnet 4.5からGPT-5.1、Gemini 3、GPT-5.1 Codex Max、そしてClaude Opus 4.5へと、AIの三大プロバイダーが次々とトップを塗り替えていったのです。

しかし、本当に重要だったのはモデルのベンチマーク競争ではありません。この時期に「コーディングエージェント」が実用レベルに到達したことです。OpenAIとAnthropicは2025年の大半を「検証可能な報酬からの強化学習（RLVR）」に費やし、コード品質の向上に取り組んできました。その成果が11月に開花し、コーディングエージェントは「たまに動く」から「だいたい動く」へと進化。愚かなミスを修正する時間よりも、実際にコードを書く時間の方が長くなったのです。これが決定的な変化だったと思います。

パーソナルAIアシスタント「Claw」の台頭

11月末にひっそりと最初のコミットが行われた「Warelay」というプロジェクトは、何度かの名前変更を経て、2月には「OpenClaw」として世界を席巻しました。わずか3ヶ月のプロジェクトがこれほどの注目を集めるというのは異例中の異例です。

OpenClawは「パーソナルAIアシスタント」で、NanoClawやZeroClawなど類似プロジェクトも登場し、これらは総称して「Claw」と呼ばれるようになりました。シリコンバレーではMac Miniが品薄になったそうです。みんな自分のClawを動かすために買っていたからですね。Drew Breunig氏は「新しいデジタルペットで、Mac Miniはその水槽だ」とジョークを飛ばしていたとのことですが、なかなか的を射た表現だと思います。

ノートPCで最先端AIが動く時代

もう一つの大きなトレンドは、ローカルで動作するオープンウェイトモデルの急速な進化です。GoogleのGemma 4シリーズは米国企業発で最も高性能なオープンウェイトモデルとして登場し、中国のGLMからは1.5TBという巨大なGLM-5.1がリリースされました。

特に印象的だったのは、Qwen3.6-35B-A3B（わずか20.9GB）がノートPCで動作し、特定のタスクでClaude Opus 4.7を上回る結果を出したという事例です。かつてクラウドの巨大GPUでしか動かせなかったレベルのAIが、手元のノートPCで走る時代が来たことを象徴しています。

年末年始の「バイブコーディング祭り」

12月から1月にかけての年末年始、多くの開発者がこの新しいコーディングエージェントで遊び倒しました。Willison氏自身もPythonでJavaScriptを実装するという「micro-javascript」プロジェクトを作り上げました。「JavaScript → WebAssembly → Python → Pyodide → ブラウザ」という多層構造で動作させたそうです。

技術的には面白いけれど「バグだらけで遅くて安全性もないJavaScript実装をPythonで必要とする人はいなかった」と本人が振り返っているのが面白いですよね。AIの能力に興奮しすぎて野心的すぎるプロジェクトを量産してしまう現象を、氏は「LLM psychosis」と呼んでいました。心当たりのある方も多いのではないでしょうか。

まとめ — 2つの大きなうねり

この半年間のLLM進化を一言でまとめるなら、「コーディングエージェントが本当に使えるようになった」ことと「ノートPCで動くモデルが期待を大きく超えてきた」ことです。

私も日常的にコーディングエージェントを使っていますが、半年前と比べると確実に「指示を出す側」の比重が増し、「修正する側」の比重が減りました。そしてローカルLLMの進化は、クラウド依存からの脱却という選択肢を現実のものにしています。AIの民主化は着実に進んでいると感じます。

📰 参考：https://simonwillison.net/2026/May/19/5-minute-llms/

← ブログ一覧に戻る