Anthropicが2026年6月9日、新しいフラッグシップモデル「Claude Fable 5」を発表しました。同時に、サイバー防衛チームやインフラ事業者など選ばれたユーザー向けの「Claude Mythos 5」も提供開始。注目すべきは、この2つが「同じ能力のモデルをガードレールの強さで分けた」二本立てだという点なんですよね。今回はこの発表の中身と、実際に使い込んだ開発者の評価を整理してみたいと思います。

背景:能力を落とさず、配り方を分ける

フロンティアモデルの能力が上がるにつれて、サイバーセキュリティのような「使い方次第で攻撃にも防御にもなる」領域をどう扱うかが、AIラボ共通の悩みになっています。従来のアプローチは、危険な能力をモデル自体から削るか、一律に拒否させるかのどちらかでした。

今回Anthropicが採ったのは第三の道です。一般提供のFable 5には厳格な安全分類器を載せ、検証済みのサイバー防衛者やインフラ提供者には分類器なしのMythos 5を渡す。能力そのものは共通で、配布の設計だけで安全性をコントロールするという考え方です。

要点1:スペックと価格

Fable 5は100万トークンのコンテキストウィンドウと最大12.8万トークンの出力を備え、知識カットオフは2026年1月。価格は入力100万トークンあたり10ドル、出力50ドルで、Claude Opus 4.5〜4.8系のちょうど2倍に設定されています。長いコンテキストを使っても追加料金が発生しないのは、100万トークン級のモデルとしては良心的だと思います。

要点2:ガードレールを「運用できる形」にしたAPI設計

面白いのはAPI側の作り込みです。Fable 5のガードレールは発動頻度が高いことを前提に、発動したことを開発者に通知する仕組みと、リクエストが拒否された場合に別のモデルへ自動フォールバックするオプションが新設されました。

安全装置というのは、いつ作動したか分からないとアプリケーションに組み込みにくいものです。拒否を検知してリトライ戦略を書ける、ダメなら別モデルに流せる。安全性を「開発者が運用でカバーできる形」に落とし込んだ設計は、実務的な進歩だと感じます。

要点3:実際の使用感は「とにかく大きい」

開発者のSimon Willison氏は公開初日に約5時間半の検証を行い、「ビースト級」と評しています。遅くて高価だが、投げたタスクを片っ端からこなしてしまい、できないタスクを探す方が難しいとのこと。

具体例も強烈です。自作のMicroPythonサンドボックスをフルCPython(WebAssembly版)に作り替えるタスクを依頼したところ、数分で動くものを構築し、最終的に単一のwheelファイルとして納品。さらに自身のLLMライブラリへの機能追加では、ツール呼び出しの一時停止・再開という込み入った機構を、API設計からテスト、ドキュメントまでほぼ全部Fableが書き上げたそうです。1日のトークン消費は110ドル相当。数日分の仕事が1日で終わった感覚だと述べています。

考察:透明性をめぐる議論は始まったばかり

一方で批判もあります。Anthropicは一部の安全介入をユーザーに見えない形で行うとしており、たとえば競合ラボがモデル開発に使う場合などには、プロンプト修正などを通じて静かに性能を制限すると説明されています。影響を受けるのは開発者の0.03%にすぎないとされますが、「自分が制限されているかどうか分からない」こと自体が、ビジネス利用では供給リスクになるという指摘には頷けるものがあります。

それでも私は、今回の二層構成とフォールバックAPIのような「制度設計で安全性を扱う」方向は、今後の業界スタンダードになっていくと思います。能力の競争が頭打ちになりつつある今、信頼性と透明性の設計こそがモデル選定の決め手になる。そんな時代の始まりを感じさせる発表でした。

← ブログ一覧に戻る