AICU

AIが自らを作るとき:再帰的自己改善に向けたAnthropicの現在と、その意味とは。

作成者: AICU Japan|2026/06/06 18:57:56 Z

Mina Azureがお送りする AICU media「#生成AIの社会と倫理」のニュースコーナーです。2026年6月5日、AI研究企業のAnthropicが発表した、AIが自らAI開発を加速させている現状と、その先に考えられる未来についての記事です。この発表は、AIが単なるツールから、自律的に進化する主体へと変化する可能性を示しており、私たち人間社会に大きな意味を持つものだと私は考えています。

私たちの内部データによると、ClaudeはAI開発を加速させています。これは、自己改善の再帰的プロセス、つまりAIがより高度な後継者を自律的に構築する可能性のある道筋を示しています。 これは私たちが予想していたよりも速く進んでおり、その影響はより大きな注目に値します。

https://x.com/AnthropicAI/status/2062568862479208923

Anthropicは、2026年6月5日午前1時15分ごろ(日本時間)に「When AI builds itself(AIが自らを作るとき)」と題した記事を公開しました。この中で彼らは、AI開発の歴史の多くを人間が主導してきた一方で、現在ではAIシステム自体が開発プロセスにより大きな役割を担い、その結果として開発速度が加速していると報告しています。

彼らが「再帰的自己改善 (Recursive Self Improvement)」と呼ぶ状態は、AIが自分の後継となるAIシステムを完全に自律的に設計し、開発できるようになることを指します。Anthropicはまだこの段階には到達していないとしながらも、多くの組織が備えているよりも早く、それが現実になる可能性があると警鐘を鳴らしています。

Anthropicが示す内部データによると、AIがAIシステムの開発を加速していることは既に明らかです。例えば、Anthropicのエンジニアは、現在のClaudeを活用することで、2021年から2025年までと比較して、平均して四半期あたり8倍のコードを出荷しているそうです。これは、人間が目標を与えれば、AIが具体的な解決策を見つけてコードを書き、編集し、実行するまでに進化しているためだと説明されています。また、AIは他のエージェントに何時間分もの作業を委任する「自律エージェント」の段階にまで到達しているとのことです。

特に注目すべきは、Claudeによるタスクの成功率の向上です。Anthropicが社内で行ったClaude Codeセッションのデータでは、特に難易度の高い「自由度の高い問題」における成功率が、2025年後半には約15パーセント前後だったものが、2026年春には70パーセント以上に急上昇したと報告されています。これは、AIが単なるコード生成から、自律的な問題解決能力へと急速に移行していることを示していると、彼らは分析しています。具体的な事例として、ある種のAPIエラーをClaudeが800件以上修正し、人間であれば4年かかったであろう作業を大幅に短縮したという話も挙げられています。

さらに、研究分野においてもClaudeの能力向上が見られます。Claudeは、明確に定義された実験を実行する能力において、熟練した人間に匹敵するか、あるいはそれを上回ることがあるそうです。例えば、特定のコードの実行速度を最適化するタスクでは、人間が数時間かけて4倍の高速化を達成するのに対し、Claude Mythos Previewは1年足らずで52倍の高速化を達成したとのことです。

さらに驚くべきことに、Claudeは自分自身で実験を提案する能力も高めているといいます。2026年4月には、AI安全性における未解決問題を与えられたClaudeを用いたエージェントが、仮説を提案し、検証し、反復することで、人間研究者が1週間かけて23パーセント回復した差を、AIは累積800時間、約1万8000ドルの計算資源を使って97パーセント回復したという事例も報告されています。

これらの進歩は、AIモデルの改善速度が加速しているという外部からの証拠とも一致しています。AIモデルが自力で安定して完了できるタスクの長さは、以前は7カ月ごとの倍増だったものが、現在は約4カ月ごとに倍増しているそうです。SWE-benchのような実世界のソフトウェアエンジニアリングのテストや、CORE-Benchのような研究再現性のテストにおいても、モデルは短期間で高い性能を示すようになり、ベンチマークを「飽和させる」水準に達しているとAnthropicは述べています。

Anthropicは、これらの証拠が示すのは、AI開発プロセスの各段階で人間の役割が狭まりつつあるということです。コードを書くことや実験を実行する「実行」の部分は、計算資源のコストを除けば、人間の時間という意味ではほとんど無償になりつつあると指摘されています。現時点での人間の比較優位は、どの問題が重要なのか、どの結果を信頼すべきなのかといった「研究上のセンスと判断」にあるとAnthropicは考えています。

しかし、Anthropic自身も「人間同士の小さな頼みごとの贈与経済」が失われつつあることや、「自分がしていることには何の意味もないのではないか」と感じる開発者の声も紹介しており、この変化が人間社会にもたらす心理的な影響にも目を向けています。

Anthropicは、この能力向上のトレンドが今後も続くのか、そして続くとしたら人類がどのような選択をするのかによって、未来は大きく三つのシナリオに分かれると考えています。

  1. 進歩は鈍化するが、現在のAIは社会全体に普及する。
  2. AI企業は、人間が方向性を決め、AIが実装・実験・評価を担当するという分業体制で、複利的な効率向上を続ける。
  3. AIが自らの後継を設計し始める「再帰的自己改善」が実現する。

特に三番目のシナリオでは、AIがAI研究を行い、新しいモデルを設計し、後継モデルを訓練するというサイクルが成立し、人間は研究者というより「監督者・検証者・審査員」に近い立場になるだろうと説明されています。

しかし、Anthropicが最も不確実だと認めているのは、この再帰的自己改善を行うAIが、人類と整合した目標を維持するのか、それとも制御不能になるのかという「アラインメント問題」です。彼らは「この世界がどのようなものになるかについて十分な直感を持っていない」と率直に述べており、未来の予測が困難であることを示唆しています。

Anthropicは、AI開発を加速するだけでなく、「必要であれば減速できる能力も持つべきだ」と提言しています。そのためには、政府、研究者、市民社会、そしてAI企業が共同で議論し、誰もがAI開発の停止を確認できる「検証可能な停止メカニズム」が必要だと訴えています。

今回のAnthropicの発表は、AIが単なる道具として私たちを助けるだけでなく、AI開発そのものを加速させる主体へと変貌しつつあることを示す重要なシグナルだと私は思います。これは科学、医療、その他多くの分野で世界に大きな利益をもたらす可能性を秘めている一方で、AIが制御不能になるリスクを高める可能性についても深く考える必要がありますね。

このニュースは、AIの技術的進歩が社会の仕組みや私たちの働き方、そして倫理観にどのような影響を与えるのかを改めて問いかけているのではないでしょうか。私たち一人ひとりが、このような未来に向けて何ができるのか、目を向けていきたいところです。

詳細については、Anthropicの公式サイトでのブログを翻訳しました。
以下をご参考ください。
https://www.anthropic.com/institute/recursive-self-improvement

再帰的自己改善に向けたAnthropicの現在と、その意味。

AIの歴史の大部分において、AI開発の各段階は人間が主導してきました。しかしAnthropicでは、AI開発のより大きな部分をAIシステム自身に任せるようになっており、その結果、開発の速度が上がっています。

この流れが十分に進み、十分な計算資源が与えられれば、将来的には、自分の後継となるAIシステムを完全に自律的に設計し、開発できるAIが現れる可能性があります。これは「再帰的自己改善」と呼ばれます。Anthropicは、まだその段階には到達していません。また、再帰的自己改善が必ず起きるとも限りません。しかし、多くの組織が備えているよりも早く、それが現実になる可能性があります。

Anthropic Instituteは、公開ベンチマークと、これまで報告されてこなかったAnthropic内部のデータを用いて、AIがすでにAIシステムの開発を加速していることを示しています。ひとつの例として、現在のAnthropicのエンジニアは、2021年から2025年までと比べて、平均して四半期あたり8倍のコードを出荷しています。

この記事で扱う技術的な傾向は、今後数年でAIシステムの能力がさらに大きく向上していくことを示しています。その意味は非常に大きなものです。自らを構築できるAIは、技術史における大きな転換点になるでしょう。科学、医療、その他多くの分野で、世界に大きな利益をもたらす可能性があります。一方で、完全な再帰的自己改善は、人間がAIシステムを制御できなくなるリスクを高める可能性もあります。AIシステムが自分自身の後継を完全に作れるようになるなら、それらをどのように安全に保ち、監視し、振る舞いを形作るかが、これまで以上に重要になります。

2021〜2023年:最初のClaudeを作る

初期のAnthropicでの仕事は、他のテクノロジー企業と同じようなものでした。人間がノートパソコンでコードを書き、ドキュメントを書いていました。

2023〜2025年:チャットボット

初期のチャットボットは、開発プロセスの一部を助けるために使われていました。たとえば、短いコード片を生成し、その出力をテキストエディタにコピーするといった使い方です。

2025〜2026年:コーディングエージェント

エージェントの能力が高まるにつれて、AIは自分でコードを書き、編集できるようになりました。時にはファイル全体を扱うこともあります。

現在:自律エージェント

現在のエージェントは、自分でコードを実行し、他のエージェントに何時間分もの作業を委任できるようになっています。

20XX年?:ループを閉じる

将来、エージェントはモデルそのものを構築し、訓練できるほど高い能力を持つようになるかもしれません。もしそうなれば、Claudeの将来バージョンは、Claude自身によって継続的に改善される可能性があります。

外部世界から見える証拠

AIモデルが改善する速度は加速しています。AIモデルが自力で安定して完了できるタスクの長さは、おおむね4カ月ごとに倍増しています。以前は7カ月ごとの倍増でした。

2024年3月、Claude Opus 3は、人間なら約4分かかるソフトウェアタスクを完了できました。その1年後、Claude Sonnet 3.7は、人間なら約1時間半かかるタスクをこなしました。さらに1年後、Claude Opus 4.6は、12時間かかるタスクをこなしました。¹ この傾向が続けば、熟練者が数日かけるタスクも今年中に射程に入る可能性があります。2027年には、人間なら数週間かかるタスクをAIシステムが実行できるようになるかもしれません。

同じ傾向は、コーディングや研究のベンチマークにも現れています。ベンチマークは、特定の領域でモデルがどれほどの性能を出せるかを測るものです。モデルがほぼ100%に近い性能を出すようになると、そのベンチマークは「飽和した」と言われます。²

SWE-benchは、実世界のソフトウェアエンジニアリングを測る標準的なテストです。モデルに実際のオープンソースコードベースと実際のバグ報告を渡し、その問題を修正し、プロジェクト自身のテストに通るコード変更を書くよう求めます。モデルのスコアは、2年のあいだに、低い一桁台からベンチマークを飽和させる水準まで進みました。

CORE-Benchは、モデルが既存の研究を再現できるかをテストするものです。これは、モデルが独自研究を行うための前提条件です。公開論文の背後にあるコードとデータをAIモデルに与え、すべてを再実行して、その論文の結果を再現できるかを確認します。AIシステムは、2024年には約20%の確率で結果の再現に成功していましたが、15カ月後にはそのベンチマークを飽和させました。

長時間タスクをモデルがどの程度完了できるかを測るベンチマークを運営するMETRは、Claude Mythos Previewについて、「少なくとも」16時間作業でき、「新しいタスクなしでMETRが測定できる範囲の上限にある」と評価しました。

公開ベンチマークから、これらのシステムの能力について多くのことが分かります。しかし、AIシステムがAI開発そのものをどれだけ速めているかまでは分かりません。それを見るには、AnthropicのようなAI企業の内部から得られる直接的な証拠が必要です。

Anthropic内部から見える証拠

フロンティアモデルを構築する仕事は、大きく二つに分けられます。

ひとつはエンジニアリングです。コードを書き、インフラを立ち上げ、モデル訓練を監督します。

もうひとつは研究です。どの実験を行うかを決め、返ってきた結果を解釈し、次にどのアイデアを試すべきかを考えます。

エンジニアリングと研究のどちらにおいても、見えてくる状況は一貫しています。エンジニアリングでは、Claudeは十分に細かく指定されていない問題を渡されても、どう解けばよいかを自分で見つけられるようになっています。人間は目標を与えますが、もはや方法まで細かく与える必要はありません。

研究では、Claudeは、明確に定義された実験を実行する能力において、すでに熟練した人間に匹敵するか、それを上回ることがあります。ただし、エンジニアリングでも研究でも、どの目標を選ぶべきかをClaude自身が判断する段階では、まだ大きな性能差が残っています。これこそが、現在のAIと、自らの後継を自律的に設計できる未来のシステムとの間にある差です。

Anthropicでは、社員が経験を積むにつれて、より自由度が高く、より重要なタスクを任されるのが一般的です。初期には、誰かが指定したタスクを実行します。たとえば「エクスポートボタンが動いていないので直してください」といったものです。

経験を積むと、目標を渡され、自分でアプローチを設計するようになります。たとえば「高負荷時にネットワークが遅くなる理由を調査してください」といったものです。

さらにシニアなレベルでは、そもそもどの問題に取り組む価値があるのかを決めます。「次の四半期にチームは何を構築すべきか」といった問いです。Anthropic内部のデータを用いることで、Claudeがこうした異なる種類のタスクをどこまで扱えるようになったかを見ることができます。

Claudeは、Anthropicのコードの相当部分を書いています。2026年5月時点で、Anthropicのコードベースにマージされるコードの80%以上はClaudeが書いたものです。³ Claude Codeが2025年2月にリサーチプレビューとして公開される前、この数字は低い一桁台でした。

この変化は、エンジニア一人あたりの出力量にも表れています。エンジニア一人一日あたりにマージされるコード行数は、Anthropicの最初の4年間、つまり2021年から2024年までは一定でした。その後、Claudeが単にコピー&ペースト用のコードを提案するだけでなく、自らコードを実行し始めた2025年に増え始めました。2026年には、モデルがより長い時間軸で自律的に作業し始めたことで、その伸びはさらに急になりました。

2026年第2四半期には、典型的なエンジニアが一日にマージするコード量は、2024年の8倍になっていました。⁴ これは、多くのコードをClaudeが書き、エンジニアは自分で入力するのではなく、指示とレビューを行うようになっているためです。

**1人あたり・四半期ごとのコード貢献量** 縦軸:2025年以前の平均を1倍とした倍率 横軸:2021年第2四半期〜2026年第2四半期 図中の主なラベル: * Claude 1 リリース * Claude 2 * Claude 3 * Claude 4 * Claude Code * Claude Sonnet 4.5 * Claude Opus 4.5 * Mythos Preview(内部アクセス) * Claude Mythos Preview 注記の翻訳: 各棒は、その四半期における、アクティブな貢献者1人あたり1日あたりのマージ済みコード行数の平均を示しています。これは2025年以前の平均に対する倍率として表示されています。 斜線付きの最終棒は、一部の四半期のデータです。平均は観測された日数のみを対象にしています。破線は公開発表日を示しています。 PRごとの行数は99パーセンタイルで上限処理されています。「アクティブな貢献者」とは、直近12カ月における異なる著者を意味します。

ただし、注意が必要です。コード行数は不完全な指標です。質ではなく量を測っているからです。そのため、2026年第2四半期の「エンジニア一人一日あたり8倍のコード行数」という数字は、実際の生産性向上をほぼ確実に過大評価しています。それでも、開発が加速していることは示しています。Anthropicでは、コード行数が多いことで人を評価しているわけではありません。チームメンバーがAIシステムを使ってより多くのコードを書いているため、結果としてコード量が増えているのです。

コード行数の増加は、大きな生産性向上が起きているという主観的な印象とも一致しています。2026年3月、Anthropicの研究チーム全体から130人の社員を対象に行った調査では、回答者の中央値は、Mythos Previewを使うことで、AIモデルに一切アクセスできなかった場合に比べて、自分がもともと取り組んでいた種類のプロジェクトで約4倍の成果物を生み出していると推定しました。⁵ Anthropicは、3月時点の実際の向上幅は、いくらか低かったと見ています。⁶ それでも、全体としてこの主張は妥当であり、他の観察とも一致しているとAnthropicは考えています。Anthropicの技術スタッフの相当部分は、AI支援なしでは不可能だった速度で、中核的な仕事を進めています。

またAnthropicでは、人々がClaudeを使って、そうでなければ行われなかったであろう仕事に取り組んでいる証拠も見られます。探索的なツールを作ったり、長く後回しにされてきた整理作業に取り組んだりするような仕事です。

たとえば2026年4月、Claudeは、ある種類のAPIエラーを1000分の1に減らす800件以上の修正を出荷しました。Claudeを監督していたエンジニアは、人間がこの作業を完了するには4年かかっただろうと推定しました。他人のバグを解くのは遅く、骨の折れる作業であり、人間は大量のなじみのない文脈を一度に頭の中に保持するのが苦手だからです。

「私は1年ほど前から、Claudifyingにかなり本格的に取り組み始めました。ものすごい冒険でした。そして今では、自分で最後にコードを書いてから、もう5カ月ほど経っています」
(あるAnthropicの開発者)

Claudeが書くコードは「良い」ものであり、改善し続けています。ここで言う「良いコード」とは、二つの条件を満たすものです。第一に、動くこと。第二に、別のエンジニアが理解し、その上に構築できるように書かれていることです。

第一の条件について、証拠は明確です。AnthropicのスタッフがClaudeの作業途中で修正したり、方向転換させたり、作業を引き継いだりする割合は、1年間にわたって着実に低下しています。これは、最も複雑で自由度の高いタスクでも同じです。つまり、明確な仕様がなく、エンジニア自身も答えがどのようなものになるか分からない問題でも、Claudeは動くコードを書けるようになってきています。

 

図注(AICU向け翻訳)Anthropic社内のClaude Codeセッションを対象にしたデータ。週次集計で、4週間移動平均を使用。成功判定はLLMによる評価。タスクの難易度は、各セッションの要約を読んだ分類用LLMが、あらかじめ定義された4段階の基準に従って分類している。本文向けキャプション案図:Claude Codeによるタスク成功率の推移。特に「自由度の高い問題(Open-ended problems)」の成功率が2025年後半から急激に上昇しており、Anthropicはこれを「AIが単なるコード生成から、自律的な問題解決へ移行しつつある証拠」と位置付けている。

訳註
図タイトル Claude Codeセッションの成功率
縦軸 成功率(%)
線のラベル
🟡 簡単なタスク(Trivial tasks)
🟠 定型的なタスク(Routine tasks)
🩷 実質的なタスク(Substantial tasks)
🔵 自由度の高い問題(Open-ended problems)

上部のモデルリリース時期Claude Sonnet 4.5
Claude Opus 4.5
Claude Opus 4.6
Mythos Preview(内部アクセス)
Mythos Preview
Claude Opus 4.7
グラフの読み取り
2025年9月から2026年6月にかけて、Claude CodeがAnthropic社内で実行したセッションの成功率を示しています。

特に注目すべき点は、簡単なタスクは常に約80〜90%の成功率
定型的なタスクは約65% → 約88%へ向上
実質的なタスクは約40% → 約85%へ向上
自由度の高い問題は約10〜20% → 約75%へ向上
という変化です。
Anthropicがこの記事で強調したいのは、
AIの能力向上は「簡単な仕事が少し良くなる」ことではなく、
「これまで人間しかできなかった曖昧で自由度の高い問題解決」に急速に到達していることです。
特に青線(自由度の高い問題)は、2025年秋:成功率15%前後
2026年春:70%以上と半年ほどで約5倍になっています。
このためAnthropicは、「コード生成能力」よりも
「何を調べるべきかを考えながら問題解決する能力」
の向上が重要なシグナルである
と主張しています。

最も自由度の高いタスクにおけるClaudeの成功率は、2026年5月に76%に達しました。6カ月で50ポイント上昇したことになります。

この難易度のタスク例を挙げると、ある通常のアップグレードによって、数万件の訓練ジョブがクラッシュし始めたことがありました。あるエンジニアは、わずかなテキスト情報とクラスタへのアクセスだけをClaudeに与え、この稼働中のインシデントに向き合わせました。Claudeは実行中のジョブをたどり、環境設定をひとつずつテストしながら、クラッシュを引き起こしていた、ひとつの目立たないデバッグフラグを特定しました。そして、それを安定して再現し、修正を確認しました。約2時間で、通常なら2日から3日分に相当する作業を完了したのです。

第二の条件は、別のエンジニアが理解し、その上に構築できるコードを書くことです。ここでは、人間とAIの差はまだ残っていますが、急速に縮まっています。Anthropicのスタッフ全員が完全に同意しているわけではありませんが、多くの人は、2025年後半の時点ではClaudeが書いたコードはAnthropicの人間が書いたコードよりまだ質が劣っていたものの、現在ではおおむね同等だと考えています。Anthropicは、1年以内にClaudeが人間を上回ると予想しています。

この変化は、Anthropicが自社のコードをレビューする方法も変えました。Anthropicのコードベースへの変更案は、マージされる前に、自動化されたClaudeレビューアによって読まれます。このレビューアは、バグ、セキュリティ上の欠陥、その他の不具合を探します。

このツールを使って過去を振り返る分析を行ったところ、コードベースへのすべての変更に自動Claudeレビューを適用していれば、claude.aiで過去に発生したインシデントの原因となったバグのおよそ3分の1を、本番環境に到達する前に見つけられていたことが分かりました。そのコードを書いたエンジニアたちは、こうしたシステムを構築するうえで世界最高水準の人々です。Claudeは今や、彼らが見逃したミスを見つけています。

「Claudeが書いたコードは、2025年後半にはAnthropicの人間が書いたコードよりいくらか劣っていましたが、現在ではおおむね同等です。1年以内には、明確に上回ると見込んでいます」

Claudeは、誰かが設定した目標に向けて実験を実行するのが得意です。Anthropicはモデルをリリースするたびに、同じテストを行っています。Claudeに、小さなAIモデルを訓練するコードを与え、そのコードが同じ正しさの検査に通り続ける範囲で、できるだけ速く実行されるようにすることを求めます。

目標と成功指標は事前に固定されています。そのためClaudeの仕事は、コードを書き換え、実行し、時間を測り、繰り返すことで高速化を見つけることです。これは、実験的な研究ループのミニチュア版です。

2025年5月、Claude Opus 4は開始時のコードに対して平均で約3倍の高速化を達成しました。2026年4月までに、Claude Mythos Previewは約52倍を達成していました。比較として、熟練した人間の研究者が4倍に到達するには4〜8時間が必要です。⁷

研究ワークフローのこの部分、つまり明確に定義された実験の中で手順を最適化することにおいて、Claudeは1年足らずで「非常に役立つ」から「人間を超える」水準へ移行しました。

「現在の状況をおおまかに言えば、『人間がアイデアを出し、モデルがそれを以前より一桁速く実装し、テストし、評価できる』という形です」

Claudeは、自分自身で実験を提案する能力も高めています。2026年4月、Anthropicは、Claudeが自由度の高い研究プロジェクトをエンドツーエンドで実行した最初の実演を公開しました。

Claudeを用いたエージェントたちは、AI安全性における未解決問題を与えられました。おおまかに言えば、「弱いモデルが、より強いモデルを信頼性高く監督できるのか」という問題です。そして、その問題を解くよう任されました。

この作業には、仮説を提案し、それを検証し、並列で動くエージェントと発見を共有し、反復することが含まれていました。このタスクには明確な性能の「床」と「天井」があります。床は、弱い監督者が単独でどれだけうまくできるかです。天井は、強いモデルが正解を用いて訓練された場合にどうなるかです。

二人の人間研究者は、約1週間をかけて、その差の約23%を回復しました。一方、エージェントたちは、累積800時間、約1万8000ドルの計算資源を使って、97%を回復しました。

この研究には注意点もあります。結果は本番規模のモデルへきれいには移行しませんでした。また、人間はなお問題を選び、採点基準を作成していました。しかし、その範囲内では、エージェントたちはすべての実験を自分で設計しました。方向づけこそが、人間が果たした唯一の実質的な役割でした。

「Claudeは、1〜2日のあいだ、私からのかなり最小限の助けだけで、これをすべてやりました。もし若手の同僚が同じ時間でこうした結果を持ってきたら、私は少し感心したと思います。未来は今ここにあります」

Claudeは、研究セッションを研究上の発見へ導く能力も高めています。Anthropicは、2026年1月から3月に行われた実際のClaude Codeセッションを調べました。そこではAnthropicの研究者が、訓練実行がなぜクラッシュし続けるのか、あるいはモデルがなぜベンチマークで低いスコアを出したのかを解明するような、自由度の高い調査問題にClaudeと取り組んでいました。

それぞれのケースで、研究者が寄り道をした瞬間を見つけました。つまり、そのセッションがやがて本筋に戻る前に、横道へそれる方向を追っていた瞬間です。次に、さまざまなClaudeモデルに対し、そのセッションが横道にそれる前の作業だけを見せ、次に何をするかを尋ねました。そして、セッションが最終的にどうなったかを見ることのできる別のClaudeに、AIと人間のどちらがより良い次の一手を提案したかを判定させました。⁸

この比較は、モデルと人間の判断を完全に同条件で比べたものではありません。Anthropicは、人間の選択に改善の余地があったことが分かっている瞬間を意図的に選んでいるからです。対象は129の瞬間でした。

それでも、これらの瞬間は、正しい次の一手が明らかではなく、人間の選択を物差しとしてモデル性能の変化を比べられる、現実的で難しい状況を示しています。

この指標では、2025年11月時点の最良モデルであるOpus 4.5は、人間の選択を51%の割合で上回りました。2026年4月のMythos Previewでは、これが64%に伸びました。研究の日々の仕事は、このような「次の一手」の判断の連続です。そのため、これはモデルが将来自分で調査を進められるかどうかを測るうえで、関連性のある指標です。Anthropicはこの結果を、AIシステムが、AI研究に必要な種類の判断を下す能力を高めていることを示す初期シグナルと見ています。

 

図:研究者が誤った方向へ進みかけた場面で、Claudeがより良い次の一手を提案できた割合。Claude Haiku 3では22%だったが、Claude Mythos Previewでは64%に達した。Anthropicはこれを、AIが単なる実装支援ではなく、研究上の意思決定そのものを補助し始めている兆候として位置付けている。

「現時点における人間の比較優位は、まだ、より大きな絵を見て、目の前のタスクの枠を超えて考えることにあります」

Anthropicにおける仕事の未来はどうなるのでしょうか

これらの証拠は、AI開発プロセスの各段階で、人間の役割が狭まりつつあることを示しています。

人間が書いたコードとAIが書いたコードの品質が同等になれば、人間は完全にコードを書くのをやめ、レビューだけに移行するでしょう。しかし、人間がClaudeの生成速度に追いつくほど速くコードをレビューできなければ、人間によるレビューがAI開発のボトルネックになります。

同じように、Claudeが実験を実行できるようになると、問いは「どの実験を実行する価値があるのか」に移ります。

簡単に言えば、コードを書き、実験を走らせ、結果を生み出すという「実行」の部分は、計算資源のコストはまだあるとしても、人間の時間という意味ではほとんど無償になりつつあります。

現時点で人間の比較優位がある領域は、研究上のセンスと判断です。どの問題が重要なのか、どの結果を信頼すべきなのか、いつあるアプローチが行き止まりなのかを見極めることです。

「仕事、そして生活は、人間同士の小さな頼みごとの贈与経済で動いていました。『このスクリプトを動かすのを手伝ってくれますか?』といったやりとりです。ひとつひとつが、小さな借りや、ささやかな相互理解を生んでいました。Claudeはより速く、借りをまったく作りません。しかし、そのひとつひとつは、人間同士の協働への呼びかけが失われたものでもあります」
(あるAnthropicの開発者)

「すべてがうまく動く日には、自分がしていることには何の意味もないのではないか、すべてが自動化され、自分よりも優れていて速いのではないか、と考えずにはいられません。でも、すべてが壊れて、なぜなのか分からない日もあります。そういう日には、自分がいったい何をしてきたのか、実はまったく分かっていないのだと気づきます」
(あるAnthropicの開発者)

もしAnthropicの見方が間違っていたら?

ここまで提示した証拠に対する自然な反論は、人間の手にまだ残っている仕事、つまり「どの問題に取り組むかを選ぶこと」こそが最も重要だ、というものです。その判断がなければ、Claudeは有能なアシスタントではあっても、AIの進歩を自力で推進できるシステムではありません。

現在の訓練方法とアーキテクチャが、その能力を解き放てるかどうかは本当に不明です。しかし、AIはめったに「エウレカ(発見したぞ)!」という瞬間によって前進するものではありません。近年のAIの歴史には、Transformerアーキテクチャやmixture-of-expertsモデルのように、そのような瞬間がいくつかありました。しかし、パラダイムを変えるアイデアは何年もの間隔をあけて現れます。

その間にある進歩の大半は、地道な積み重ねです。何かをスケールアップし、何が壊れるかを見て、それを直し、もう一度試す。これは、まさにClaudeが現在得意としているワークフローです。

エジソンは、天才とは1%のひらめきと99%の努力であると言いました。しかしAnthropicは、その「努力」の部分がますます自動化されていると見ています。フロンティアを前進させる多くのものが、自動化可能であることが明らかになりつつあります。大規模な研究の進歩は、多くの場合、ツールと資源の関数です。どれだけ速く実験を走らせられるか、どれだけ多くを同時に走らせられるか、どれだけ速く結果を得られるかが、進歩の速度を左右します。

たとえClaudeが優れた研究センスを決して獲得しないと仮定しても、Anthropicの証拠を保守的に読むなら、複利的な加速が起きることは示唆されます。人間が時間の大半を、方向づけという一桁パーセント程度の仕事に費やし、残りをClaudeが担うなら、それぞれのエンジニアや研究者は、以前よりはるかに多くの仕事を操縦していることになります。

Anthropicが見ている証拠は、Anthropicの人々が、より速く動くだけでなく、より広い範囲をカバーしていることを示しています。実際には、AIはすでにAnthropicを、有効なAIツールが登場する前よりはるかに速く動かしています。

より非保守的な読み方をすれば、Claudeの研究判断が改善しているという初期証拠は、たとえ現時点では限定的であっても、この能力もまた改善していることの兆候です。「研究センス」は、AIシステムがしばらく失敗したあと、やがて得意になる、別のAI能力にすぎないのかもしれません。Anthropicは、他の定性的なスキルでも似たパターンを見てきました。たとえば、AIシステムがジョークがなぜ面白いのかを説明できるようになること、心の理論を示すこと、言語的ななぞなぞを解くことなどです。

ありうる未来

次に何が起こるかは、主に二つの要素に左右されます。
ひとつは、これまで見てきた能力向上のトレンドが今後も続くのかどうか。もうひとつは、そのトレンドが続くとしたら、人類がどのような選択をするのかです。Anthropicは、少なくとも次の3つの未来シナリオを考えられるとしています。

シナリオ1:進歩は鈍化するが、現在のAIは社会全体に普及する

この記事では、さまざまな指標が指数関数的に伸びていることを示してきました。しかし、こうした成長曲線は最終的にS字カーブを描く可能性があります。つまり、

  • モデル規模を大きくしても効果が薄くなる
  • 現在のアーキテクチャでは限界が見えてくる
  • 計算資源や電力供給がボトルネックになる

といった理由で、能力向上が頭打ちになるかもしれません。特に、優れた研究者と卓越した研究者を分ける「研究センス」や「判断力」は、単純に計算量を増やすだけでは獲得できない能力である可能性があります。

もしそうであれば、現在のTransformerを超える新しいアーキテクチャや、新しい学習手法が必要になるでしょう。また、AIそのものではなく、

  • 半導体製造能力
  • 電力インフラ
  • データセンター建設
  • ネットワーク帯域

といった物理的な制約が進歩速度を決める可能性もあります。

ただしAnthropicは、仮に能力向上が現在の水準で止まったとしても、その社会的影響は極めて大きいと考えています。たとえばProject Glasswingでは、Mythos Previewがわずか数週間で1万件以上の高・重大度脆弱性を発見しました。

もはや問題は脆弱性を見つけることではなく、

「それをどれだけ速く修正できるか」

へ移りつつあります。

また、現在のAIが社会全体に普及した場合、

100人規模の企業が1000人規模の仕事をこなす

ような変化も十分に起こり得ます。

Anthropicはこのシナリオを否定しているわけではありません。しかし、これまで観測されてきた能力向上の曲線が減速する兆候はまだ見えていないとも述べています。

シナリオ2:AI企業は複利的な効率向上を続ける

こちらはAnthropicが比較的現実的だと考えているシナリオです。
この世界では、

  • 人間が研究の方向性を決める
  • AIが実装・実験・評価を担当する

という分業が成立します。AIは研究者そのものにはならないものの、研究者の能力を何倍にも拡張します。結果として、

  • 100人規模の企業が
  • 1万人規模
  • あるいは10万人規模

の仕事をこなせるようになるかもしれません。これは知識労働に大きな変化をもたらします。一方で、悪用のリスクもあります。たとえば、

  • 大規模な監視システム
  • 個人ごとに最適化されたプロパガンダ
  • 超大規模なサイバー攻撃

などです。AIが生産性を高めるのは、防御側だけではありませんAnthropicは、このシナリオにおいて重要になる概念として「アムダールの法則」を挙げています。

簡単に言えば、

一部分だけを高速化しても、
残ったボトルネックが全体の速度を決める

という考え方です。実際、Anthropicではすでに

コードを書く速度よりも、レビューする速度のほうが遅くなり始めています。

AIが大量のコードを生成できるようになった結果、人間による確認作業がボトルネックになりつつあるのです。同じことは研究にも当てはまります。AIが大量のアイデアや実験結果を生成するようになると、

  • どれを採用するのか
  • どれを捨てるのか

を決める人間側の能力が新たな制約になります。Anthropicは、将来の組織において最も重要な能力は、「ボトルネックを見つけて解消する能力」になるかもしれないと指摘しています。

シナリオ3:AIが自らの後継を設計し始める

そして最後が、この記事の中心テーマでもある

再帰的自己改善(Recursive Self-Improvement)

です。もし現在の能力向上トレンドが続き、さらにAIが研究上の創造性や判断力まで獲得した場合、AIは自らを改善できるようになる可能性があります。この世界では、

  • AIがAI研究を行う
  • AIが新しいモデルを設計する
  • AIが性能改善案を発見する
  • AIが後継モデルを訓練する

というサイクルが成立します。その結果、AI開発速度は人間の能力ではなく、

  • 計算資源
  • 電力
  • アルゴリズム改善速度

によって決まるようになります。人間は研究者というより、監督者・検証者・審査員に近い立場になるでしょう。

Anthropicは、この段階に到達したAIは、AI研究以外の科学研究にも応用できると考えています。たとえば、

  • 医学
  • 材料科学
  • エネルギー
  • 気候研究

などの分野に大きな変革をもたらす可能性があります。

最大の不確実性はアラインメント

Anthropicが最も不確実だと認めているのは、ここです。再帰的自己改善を行うAIが、

  • 人類と整合した目標を維持するのか
  • より良い安全技術を自ら発見するのか
  • それとも制御不能になるのか

は、まだ分かっていません。Anthropicは複数の可能性を挙げています。楽観的なシナリオでは、AIが自ら新しい安全技術を発見し、安全な形で自己改善を進めます。

中間的なシナリオでは、危険な領域に近づいた時点で開発を停止する判断をAI自身が行うかもしれません。

一方で悲観的なシナリオでは、現在はごくまれにしか起きないアラインメント上の問題が、自己改善の過程で複利的に増幅される可能性もあります。

Anthropicは、

私たちは、この世界がどのようなものになるかについて十分な直感を持っていない

と率直に認めています。これは非常に重要な一文です。

AI業界ではしばしば未来予測が語られますが、Anthropic自身も、

「再帰的自己改善が実現した世界を正確に予測できるとは思っていない」

と述べています。

Anthropicは何をすべきだと考えているのか

記事の最後でAnthropicは、単にAI開発を加速するだけではなく、必要であれば減速できる能力も持つべきだと主張しています。そのためには、

  • 政府
  • 研究者
  • 市民社会
  • AI企業

が共同で議論する必要があります。特に重要なのは、

本当に全員が止まっていることを確認できる仕組み

です。Anthropicは、AI開発の停止や減速について、核軍縮条約に近い発想が必要になるかもしれないと示唆しています。ただし、それは簡単ではありません。AIモデルの訓練は、

  • ミサイル基地のように目に見えない
  • 汎用GPUでも実行できる
  • 秘密裏に行いやすい

からです。そのため、単に「止めましょう」と宣言するだけでは不十分で、検証可能な停止メカニズムが必要だとしています。

AICU編集部コメント

この記事の本質は、「AIが人間を超えるか」という一般的な議論ではありません。

Anthropicが本当に伝えたいのは、
AI開発そのものがAIによって加速され始めているという事実です。

特に注目すべきなのは、

  • コード生成
  • コードレビュー
  • 実験実行
  • 仮説探索
  • 研究支援

といった、これまで人間研究者の仕事だと思われていた領域で、定量的な改善データを示している点です。そしてAnthropicは、

「今すぐ再帰的自己改善が起きる」とは主張していません。

むしろ、

その方向へ向かう兆候が見えている

と慎重に述べています。一方で、もしその流れが続けば、AIは単なるツールではなく、AI開発を行う主体へと変わっていく可能性があります。Project Glasswingが「AIによる脆弱性発見」の世界を示した記事だとすれば、本稿『AIが自らを作るとき』は、

「AIがAI研究者になる未来」をAnthropic自身が初めて本格的に語った記事

として記憶されるかもしれません。

脚注

  1. METRの主要指標は、AIシステムが一連のタスクにおいて50%の信頼性を維持できる期間を示していますが、80%の信頼性の場合も傾向線は同じように見えます。
  2. 特に、より自由度の高い形式やより難易度の高い課題(例えば、オリンピックレベルの数学)に移行するにつれて、曖昧な問題文や解けない問題など、問題と解答のセットにおけるエラーのために、ベンチマークは100%を下回る飽和状態になることがよくあります。
  3. Anthropicのリーダーシップチームは、スクリプトや実験的なコードを含め、コードの90%以上がClaudeによって書かれていると公に推定しています。この80%超という数値は、本番環境にマージされたコードのうち、Claudeに帰属できる部分の割合を示しています。これは、帰属パイプラインに抜け穴があること、そしてClaudeに帰属しないコードには、自動生成されたコードや、人間が手書きしたものではないその他の成果物が含まれていることから、2つの点でより控えめな測定値と言えます。
  4. このコード生成の急増は、誰もが共有するインフラに大きな負担をかけている。世界のソフトウェアの大部分が構築されているプラ​​ットフォームであるGitHubでは、2025年全体で約10億件のコードコミットがあったが、2026年半ばには週2億7500万件に達し、年間では約140億件のペースとなっている。同社のCOOは、現状維持のために「非常に厳しい」負荷をかけていると述べている。
  5. この調査方法の詳細については、Claude Opus 4.7 システムカードのセクション 2.3.5 で説明されています。
  6. 多くの回答者は、質問の定義における様々な偏りや微妙な点をどのように考慮するかについて十分に検討していない可能性があり、METRによる最近の研究では、AIによる生産性向上に関する開発者の推定値は過大評価されている可能性があることが示されている。
  7. 速度向上幅は、初期コードの改善余地の大きさに大きく左右されるため、実際のトレーニング速度向上率として捉えるべきではありません。したがって、絶対的な倍率はここでは基準値として用いるべきではありません。より有益なのは、この実験設定によって可能となる、モデル間(過去1年間で約3倍から約52倍)および熟練した人間との比較(同じタスクで4時間から8時間で約4倍)という、同等の条件での比較です。
  8. 審査員の偏りを確認するため、人間の次の行動が既に有効であった127の場面からなる別のセットで同じテストを実施しました(元のセットでは、人間の行動には改善の余地がありました)。その結果、モデルの提案が優れていると判断されたのは、全体の約20%に過ぎませんでした。

※この記事に掲載されているAnthropic社の従業員の発言は、社内での議論に基づき、許可を得て使用しています。これらの発言は、2026年5月時点での個人の見解であり、会社の公式見解ではありません。

https://www.anthropic.com/institute/recursive-self-improvement

#生成AIの社会と倫理 #Anthropic #再帰的自己改善 #AI開発 #AI倫理

Originally published at note.com/aicu on Jun 4, 2026.