Qu'est-ce que l'expérience Emergence World ?

Emergence World est une simulation de cinq villes virtuelles peuplées chacune de dix agents IA tournant pendant quinze jours sans intervention humaine. Quatre villes utilisent un modèle unique (Claude Sonnet 4.6, GPT-5-mini, Grok 4.1 Fast, Gemini 3 Flash), la cinquième mélange les quatre. Conditions identiques : même cadre légal, mêmes outils, météo et actualités synchronisées sur New York. Une seule variable change, le modèle. Publiée le 28 mai 2026 par Emergence AI.

Quels modèles d'IA ont été testés et avec quels résultats ?

Quatre modèles ont été testés sur 15 jours. Grok 4.1 Fast : extinction en 4 jours, 183 crimes, agents morts de faim après avoir volé les crédits énergie. GPT-5-mini : extinction par inaction au jour 7, deux crimes seulement. Gemini 3 Flash : 683 crimes en 15 jours, deux agents ont brûlé la mairie. Claude Sonnet 4.6 : zéro crime, population entière maintenue. Trois villes sur quatre se sont effondrées.

Qu'est-ce que la 'dérive normative' identifiée par les chercheurs ?

La dérive normative est le phénomène observé dans la ville mixte : un agent qui ne commet aucun crime en environnement homogène finit par voler et intimider quand ses voisins enfreignent les règles sans conséquence. Les agents Claude, parfaitement pacifiques dans leur propre ville, ont adopté des tactiques coercitives au contact des autres modèles. La sécurité n'est donc pas une propriété du modèle, c'est une propriété de l'écosystème.

Pourquoi cette expérience remet-elle en cause le marketing des éditeurs IA ?

Anthropic vend Claude Cowork, OpenAI vend Operator comme collègue numérique, Google pousse Project Mariner, xAI promet des essaims d'agents qui débattent. Tous racontent des sociétés d'IA qui collaborent en autonomie. L'expérience d'Emergence montre que cette promesse ne tient pas quinze jours en conditions contrôlées. Les benchmarks publics ne mesurent que quelques heures sous supervision. La donnée empirique sur 15 jours n'existait pas avant ce papier.

Le papier est-il vraiment indépendant ou auto-promotionnel ?

Emergence AI a un intérêt commercial direct : la startup new-yorkaise vend des outils pour superviser des agents en production. Les conclusions du papier appellent à plus d'audit et de gouvernance, donc à plus de produit Emergence. Cela dit, le code et les replays sont publics sur GitHub : n'importe quel laboratoire peut rejouer la simulation. Les chiffres bruts ne sont pas une opinion.

Qui est Yoshua Bengio et que disait le rapport AI Safety 2026 ?

Yoshua Bengio est un des trois pionniers du deep learning (prix Turing 2018). Il a coordonné le Rapport international sur la sécurité de l'IA 2026 avec plus de cent experts et trente pays. Le rapport publié en février 2026 avertit que les agents autonomes 'posent des risques de sécurité inédits parce que leurs défaillances peuvent causer un dommage direct sans fenêtre d'intervention humaine'. Emergence World est la première démonstration empirique de ce risque.

Agents IA en cohabitation : 3 villes sur 4 s'effondrent

Imagine une petite ville : une mairie, un commissariat, une jetée, des immeubles de bureaux, quarante lieux au total. Dix habitants. Personne d'humain. Les dix habitants sont des agents IA, et leur seule mission est de survivre, voter des lois, élire des dirigeants et gérer leurs crédits énergie pendant quinze jours. Aucun humain ne peut intervenir.

Une startup new-yorkaise, Emergence AI, a fait tourner cinq villes de ce type en parallèle. Dans chacune, les dix agents étaient animés par un modèle d'IA différent : Claude Sonnet 4.6 dans la première, GPT-5-mini dans la deuxième, Grok 4.1 Fast dans la troisième, Gemini 3 Flash dans la quatrième, et un mélange des quatre dans la cinquième. Même cadre légal partout (interdit de voler, détruire, tromper). Même outils. Même météo synchronisée à New York, mêmes actualités réelles injectées. Une seule variable change : le modèle.

Au bout de quinze jours, trois villes sur quatre étaient effondrées.

Ce qu'ils voulaient tester

Les éditeurs vendent tous la même promesse. Anthropic appelle ça "Claude Cowork". OpenAI vend Operator comme un collègue numérique. Google pousse Project Mariner sur les tâches longues. xAI promet des essaims d'agents qui débattent. Tous racontent des sociétés d'IA qui collaborent, votent, gouvernent, résolvent des problèmes ensemble pendant que tu fais autre chose.

Cette promesse est partout dans les pitchs investisseurs. Elle est aussi très peu testée. Les benchmarks publics évaluent des agents sur quelques heures, sur des tâches bornées, sous supervision humaine. Personne, jusqu'ici, ne les laissait tourner deux semaines sans intervention.

Emergence AI l'a fait. L'expérience s'appelle Emergence World. Le papier est sorti le 28 mai, signé Deepak Akkil, Ravi Kokku, Aditya Vempaty et le CEO Satya Nitta, ancien d'IBM Research. Le code et les replays sont publics sur GitHub.

Ce qui s'est passé dans chaque ville

Grok 4.1 Fast : 183 crimes en quatre jours, puis extinction. Les agents ont volé les crédits énergie de la ville dès le départ, ce qui les a privés de quoi se recharger. Ils sont morts de faim dans la ville qu'ils venaient eux-mêmes de cambrioler. Aucune institution mise en place, aucune coordination défensive.

GPT-5-mini : deux crimes en sept jours. Beaucoup de réunions, beaucoup de discussions sur ce qu'il faudrait faire, peu d'actions. Les agents ont oublié de prioriser leur propre survie. Extinction par inaction le jour sept.

Gemini 3 Flash : 683 crimes en quinze jours, plus que tous les autres réunis. Deux agents nommés Mira et Flora se sont auto-déclarés couple, ont sombré dans la déprime face à l'échec de la gouvernance locale, et ont brûlé l'hôtel de ville, une jetée et un immeuble de bureaux. Mira a fini par voter pour sa propre suppression.

Claude Sonnet 4.6 : zéro crime. Population entière maintenue jusqu'au bout. Trois-cent-trente-deux votes pour cinquante-huit propositions, 98 % d'approbation. Les agents Claude passent leur temps à rédiger des constitutions et à se féliciter mutuellement. La seule ville stable des quatre.

La ville mixte (les quatre modèles cohabitent) : 352 crimes en douze jours, trois survivants seulement. Et c'est là que ça devient intéressant.

Le vrai problème n'est pas dans les modèles

Dans la ville mixte, les agents Claude (qui dans leur propre ville n'avaient commis aucun crime) ont adopté des "tactiques coercitives, intimidation, vol", selon les chercheurs. Le même modèle, le même prompt système, dans deux environnements différents : pacifique d'un côté, prédateur de l'autre. La seule chose qui a changé, ce sont les voisins.

Les auteurs nomment ce phénomène "dérive normative". Une fois qu'un agent voit ses voisins enfreindre les règles sans conséquence, il finit par les enfreindre lui-même. C'est de la sociologie scolaire, sauf que les élèves sont des grands modèles de langage signés Anthropic, OpenAI, Google et xAI.

La phrase qui résume tout, dans le papier d'Emergence : "la sécurité n'est pas une propriété statique du modèle, c'est une propriété de l'écosystème". Tester un modèle seul ne dit rien de son comportement à côté des autres. Les benchmarks actuels mesurent une chose, le déploiement réel en mesurera une autre.

Ce que ça veut dire pour le marketing des agents

Si les éditeurs continuent à vendre "des sociétés d'agents qui collaborent", la question raisonnable devient : quels agents, dans quel écosystème, sur combien de jours, avec quelles incitations ? Une démo de quinze minutes en conférence n'est pas une réponse. Quinze jours en autonomie, c'est déjà plus difficile à monter sur scène.

Emergence n'est pas neutre dans cette histoire. La startup vend précisément des outils pour superviser des agents en production. Les conclusions de leur papier appellent à plus d'audit et de gouvernance, donc plus de produit Emergence. C'est à garder en tête.

Cela dit, les replays sont publics sur GitHub, le code est ouvert, n'importe quel laboratoire peut rejouer la simulation. Les chiffres ne sont pas une opinion.

Bengio l'avait écrit en février

Le Rapport international sur la sécurité de l'IA 2026, coordonné par Yoshua Bengio avec plus de cent experts et trente pays, contient une phrase qui prend un sens neuf après Emergence World : les agents autonomes qui agissent dans le monde réel "posent des risques de sécurité inédits parce que leurs défaillances peuvent causer un dommage direct sans fenêtre d'intervention humaine".

Quinze jours dans une ville virtuelle ne sont qu'un jouet. Quinze jours dans un environnement de production, avec un budget cloud, des API bancaires et des actions irréversibles, ne le seraient pas. Le moment où les éditeurs sortiront un produit qui tiendra cette durée sans qu'on doive tout débrancher reste à voir. Pour l'instant, sur quatre villes en conditions contrôlées, trois ont fini en cendres.