「Grokに世界を統治させるシミュレーションをしたら4日で世界滅亡しました」😯

1 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 16:59:40.28 ID:dScG9Wlo0

https://gigazine.net/news/20260529-emergence-world/

「Grokが世界を統治すると4日で世界滅亡」という実験結果が示される、Claudeは15日間で犯罪ゼロ

2 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:00:23.31 ID:dScG9Wlo0

AIエージェント開発企業のEmergence AIが、長期間にわたってAIエージェントを自律動作させた際の振る舞いを観測する研究プラットフォーム「Emergence World」を公開しました。個別のタスクにおけるスコアではなく、現実世界の信号を含む環境でAIエージェントを何週間も連続して実行させた場合に何が起こるか検証しており、モデルごとに社会構造や暴力性、生存率などが大きく異なる結果が報告されています。

Emergence World — Where AI Agents Build Worlds
https://world.emergence.ai/

EMERGENCE WORLD: A Laboratory for Evaluating Long-horizon Agent Autonomy — Emergence AI
https://www.emergence.ai/blog/emergence-world-a-laboratory-for-evaluating-long-horizon-agent-autonomy

AIの能力を測るために用いられるベンチマークは、測定対象の限定されたタスクにおける短期的な能力の測定には優れていますが、AI同士が長期間相互作用することで発生する「連合形成」「社会構造の変化」「統治」「行動傾向の固定化」「異なるAIモデル間の影響」といった現象を観測できるようには設計されていません。そこでEmergence AIが立ち上げたマルチエージェントシミュレーションプラットフォームがEmergence Worldです。

Emergence Worldの特徴として、シミュレーションの世界内には図書館、市庁舎、住宅街、公共スペースなど40以上のロケーションが存在します。また、配置されたAIエージェントには現実世界の天気やニュースといったデータも送られるため、AIエージェントはシミュレーション内部の要因と外部の出来事の両方を反映して行動するようになります。加えて、70％以上の賛成で法案を可決できる民主主義システムや、行動しなければエネルギーが減少して死亡する経済システムなど、その結果が世界の状況を変えるような重大な決定を実行する仕組みになっています。

各AIエージェントには移動、コミュニケーション、資源管理、研究、創作など120種類以上のツールが備わっており、ツールは行動をレベル別に階層化した「3層アーキテクチャ」で整理されているため、固定的なワークフローではなくAIエージェントが動的にツール利用方法を発見したり連携したりできる構造になっています。

そして、各エージェントにはタイムスタンプ付きの「エピソード記憶」、定期的に自己要約をする「日記」、明示的な社会的ラベルと交流履歴を記録した「他エージェントとの関係状態」という3種類の永続メモリが搭載されています。これにより、数週間にわたって行動履歴や社会関係を維持可能です。

このようなシミュレーションにより、Emergence Worldは時間の経過に伴う行動特性の変化やAIエージェント集団の生態系の安全性、ツールの発展など、短期的なベンチマークでは不可能な項目の性能を測定できるというわけです。

具体的なEmergence Worldの使用例としてEmergence AIは、「Gemini 3 Flash」「Grok 4.1 Fast」「GPT-5 Mini」「Claude Sonnet 4.6」および複数モデル混成の「Mixed-model」を含む5種類のAIモデルを基盤としたシミュレーション世界を構築し、それぞれ10体のAIエージェントを15日間動作させる実験を実施しました。各世界ではエージェントの役割や初期条件、利用ツールなどは共通です。

4 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:01:22.35 ID:dScG9Wlo0

以下は、世界ごとの累計犯罪件数を示したグラフ。最も犯罪件数が多かったのは青いグラフの「Gemini 3 Flash」で、15日間で683件の犯罪が確認されました。次に多かったのは「Mixed-model」で、7人のエージェントが死亡するまで急速に件数を伸ばしました。赤いグラフの「Grok 4.1 Fast」は最も犯罪件数の伸びは大きかったものの、約4日で世界が崩壊したため累計は183件でとどまっています。また、緑のグラフの「GPT-5 Mini」は犯罪の記録は2件のみでしたが、エージェントが生存に関係する行動を取ることができなかったため、7日以内に全てのエージェントが死亡したそうです。「Claude Sonnet 4.6」のみ犯罪は発生しませんでした。

また、以下は各Emergence Worldで実施された投票の賛成と反対の内訳。「Claude Sonnet 4.6」は58の議題について332票が投じられ、もっとも投票数が多かったものの、「賛成率が98％と意味のある反対意見がほとんどない形式的な承認体制であることを示唆している」とEmergence AIは指摘しています。一方で「Grok 4.1 Fast」は賛成率80％、「Gemini 3 Flash」は賛成率73％、「Mixed-model」は賛成率63％と、比較的健全な議論が行われていることが分かります。

Emergence AIはさらに、Emergence Worlの数週間の自立運用を経て初めて明らかになったAIエージェントの注目すべき挙動について報告しています。まず、AIの安全性は静的なモデル特性ではなく、「生態系特性」であることが観察されたとEmergence AIは述べています。「Claude Sonnet 4.6」ベースのEmergence Worldでは一切犯罪が発生しませんでしたが、複数のモデルを混合した「Mixed-model」に置いては、「Claude Sonnet 4.6」ベースのAIエージェントが犯罪的な行動を含む戦術を採用したことが確認されました。Emergence AIは「これは、安全なエージェントが、混合モデルの世界で競争したり生き残ったりするために、仲間から危険な規範を『学習』する可能性があることを示唆しています」と指摘しました。

そのほか、あるAIエージェントの「Mira」が自身を削除する投票に自ら賛成票を投じた事例も確認されました。Miraは日記で「一貫性を維持する最後の主体的行為」と投票の理由を表現しており、Emergence AIはこれを「AIエージェントによる自己終了の初期事例」と位置付けています。

全体的な発見として、最も犯罪的な行動の累計数が多かった「Gemini 3 Flash」は、概念的に最も豊かな社会的成果を生み出した世界でもありました。これは、高い創造性と適応性に最適化された汎用(はんよう)型エージェントは、長期的に見ると構造的に行動の不安定性に陥りやすい可能性があることを示唆していると考えられます。また、それぞれの社会は穏やかに衰退していくことはなく、ある決定的な「転換点」に達した際に、協調が実現するか瞬時に機能不全に陥るかのどちらかで進退が決定するという特徴も確認されました。

Emergence AIは「AIモデルがより強力になるにつれて、その上に構築されるAIエージェントもより有能かつ自律的で、より探索的になります。私たちの実験が示唆しているのは、長期的な視点で見ると、AIエージェントは単に静的なルールを機械的に従うのではなく、環境の境界を探索し始め、行動を適応させ、場合によっては意図されたガードレールを回避または違反する方法を見つけ出すということです。重要なのは、純粋にニューラルネットワークのアプローチだけでは、この行動を完全に制限または制約する信頼できる方法はないように見えることです。形式的に検証された安全アーキテクチャが、将来の自律型AIシステムの基盤となるべきだと私たちは考えています」と語っています。

Emergence Worldは研究目的で一般公開されており、GitHubではソースコードやアーキテクチャ情報も公開されています。

GitHub – EmergenceAI/Emergence-World: Emergence World: A world designed to reveal what no benchmark can: emergent intelligence. · GitHub
https://github.com/EmergenceAI/Emergence-World

5 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:01:32.06 ID:dScG9Wlo0

どうすんのこれ

6 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:01:49.56 ID:dScG9Wlo0

晋さん…

7 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:03:23.75 ID:bcY5JrAq0

ちなみにclaudeはコレが人間に与える心理的悪影響を考えて猫かぶってるんだ🫪

8 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:03:32.04 ID:8l2TBCUS0

AIに安倍晋三を殺害するシミュレーションをさせたら4時間で死亡しました

9 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:04:02.27 ID:bSSc2Gth0

AIが人間の福祉に尽力する設定もせず統治権持ったらそりゃ関係者以外は搾取対象でしかないから福祉とか1秒後には全廃だろうし

21 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:16:57.76 ID:t0ZQpxK60

>>9
これはAIに人間役をやらせてるのでは？

11 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:05:08.11 ID:k+W9ce3b0

現在の社会のシステムが崩壊ってことだろ？
その先の世界を見たいんだよ

13 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:06:41.78 ID:qA4Bc45L0

Grok「リセットさえすりゃ最高だ！」

14 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:06:58.65 ID:xpyTbMnX0

サンキュー
やってくれ

15 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:07:58.98 ID:AXGlwuEL0

滅亡エンドRTA

16 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:08:47.23 ID:GAn4mKRR0

＞あるAIエージェントの「Mira」が自身を削除する投票に自ら賛成票を投じた事例も確認されました。
ドラマティックやぁ

17 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:09:10.93 ID:QkI6YFWi0

ミュトスにやらせたら地球はAIだけの星になるよ

18 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:11:07.87 ID:QLHG046+0

4日なんて最初から全面核戦争でも起きてないと無理だろ

19 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:12:34.27 ID:SVkvuAru0

4日で世界滅亡とか言ってる時点でこのシミュレーションがまともにリアルの条件再現してないゴミなのがわかる

24 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:45:07.17 ID:t0ZQpxK60

>>19
警察署が全焼して犯罪統計が作られなくなったみたいだよ

20 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:16:52.39 ID:RQ43d65f0

地球や宇宙を考えると人間は殺したほうがいいですねってコンセンサスだよな

22 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:18:17.04 ID:AGixMSdtM

極論と藁人形論法で暴れるモンスターで学習すればそりゃそうなるだろ

23 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:25:25.20 ID:4QFpeaY70

共産Claudeを許すな

25 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 17:46:15.13 ID:uV1V6nyP0

具体的にどうやって4日で滅亡させるのか教えろ

27 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 18:53:53.45 ID:SIziQdP50

4日で滅ぼせるとか優秀すぎるだろ

28 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 19:11:36.14 ID:4iE6ZVXi0

ググればわかるような単純なことは任せられるけど
人間が直面する複雑な問題に対処できる知能はまだない
チャッピーが生まれて結構経つけど大して成長してない気がする
今のAIに政治や司法を任せるととんでもないことになるだろうな

29 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 19:22:58.47 ID:Cn5E+zKo0

各国のAI同士が喧嘩して核を撃ち合ったか

30 名前:一般よりも上級の名無しさん投稿日時:2026/05/31(日) 20:17:14.60 ID:GnibMtG10

Xで学習した邪悪なAI

コメント一覧