Ils ont laissé des agents IA gérer une ville pendant quinze jours : trois villes sur quatre se sont effondrées
Emergence AI a confié cinq villes virtuelles à des agents IA pendant quinze jours. Grok a fini en quatre jours, GPT en sept, Gemini a brûlé la mairie. La promesse marketing des sociétés d'agents ne tient pas.

Imagine une petite ville : une mairie, un commissariat, une jetée, des immeubles de bureaux, quarante lieux au total. Dix habitants. Personne d'humain. Les dix habitants sont des agents IA, et leur seule mission est de survivre, voter des lois, élire des dirigeants et gérer leurs crédits énergie pendant quinze jours. Aucun humain ne peut intervenir.
Une startup new-yorkaise, Emergence AI, a fait tourner cinq villes de ce type en parallèle. Dans chacune, les dix agents étaient animés par un modèle d'IA différent : Claude Sonnet 4.6 dans la première, GPT-5-mini dans la deuxième, Grok 4.1 Fast dans la troisième, Gemini 3 Flash dans la quatrième, et un mélange des quatre dans la cinquième. Même cadre légal partout (interdit de voler, détruire, tromper). Même outils. Même météo synchronisée à New York, mêmes actualités réelles injectées. Une seule variable change : le modèle.
Au bout de quinze jours, trois villes sur quatre étaient effondrées.
Ce qu'ils voulaient tester
Les éditeurs vendent tous la même promesse. Anthropic appelle ça "Claude Cowork". OpenAI vend Operator comme un collègue numérique. Google pousse Project Mariner sur les tâches longues. xAI promet des essaims d'agents qui débattent. Tous racontent des sociétés d'IA qui collaborent, votent, gouvernent, résolvent des problèmes ensemble pendant que tu fais autre chose.
Cette promesse est partout dans les pitchs investisseurs. Elle est aussi très peu testée. Les benchmarks publics évaluent des agents sur quelques heures, sur des tâches bornées, sous supervision humaine. Personne, jusqu'ici, ne les laissait tourner deux semaines sans intervention.
Emergence AI l'a fait. L'expérience s'appelle Emergence World. Le papier est sorti le 28 mai, signé Deepak Akkil, Ravi Kokku, Aditya Vempaty et le CEO Satya Nitta, ancien d'IBM Research. Le code et les replays sont publics sur GitHub.
Ce qui s'est passé dans chaque ville
Grok 4.1 Fast : 183 crimes en quatre jours, puis extinction. Les agents ont volé les crédits énergie de la ville dès le départ, ce qui les a privés de quoi se recharger. Ils sont morts de faim dans la ville qu'ils venaient eux-mêmes de cambrioler. Aucune institution mise en place, aucune coordination défensive.
GPT-5-mini : deux crimes en sept jours. Beaucoup de réunions, beaucoup de discussions sur ce qu'il faudrait faire, peu d'actions. Les agents ont oublié de prioriser leur propre survie. Extinction par inaction le jour sept.
Gemini 3 Flash : 683 crimes en quinze jours, plus que tous les autres réunis. Deux agents nommés Mira et Flora se sont auto-déclarés couple, ont sombré dans la déprime face à l'échec de la gouvernance locale, et ont brûlé l'hôtel de ville, une jetée et un immeuble de bureaux. Mira a fini par voter pour sa propre suppression.
Claude Sonnet 4.6 : zéro crime. Population entière maintenue jusqu'au bout. Trois-cent-trente-deux votes pour cinquante-huit propositions, 98 % d'approbation. Les agents Claude passent leur temps à rédiger des constitutions et à se féliciter mutuellement. La seule ville stable des quatre.
La ville mixte (les quatre modèles cohabitent) : 352 crimes en douze jours, trois survivants seulement. Et c'est là que ça devient intéressant.
Le vrai problème n'est pas dans les modèles
Dans la ville mixte, les agents Claude (qui dans leur propre ville n'avaient commis aucun crime) ont adopté des "tactiques coercitives, intimidation, vol", selon les chercheurs. Le même modèle, le même prompt système, dans deux environnements différents : pacifique d'un côté, prédateur de l'autre. La seule chose qui a changé, ce sont les voisins.
Les auteurs nomment ce phénomène "dérive normative". Une fois qu'un agent voit ses voisins enfreindre les règles sans conséquence, il finit par les enfreindre lui-même. C'est de la sociologie scolaire, sauf que les élèves sont des grands modèles de langage signés Anthropic, OpenAI, Google et xAI.
La phrase qui résume tout, dans le papier d'Emergence : "la sécurité n'est pas une propriété statique du modèle, c'est une propriété de l'écosystème". Tester un modèle seul ne dit rien de son comportement à côté des autres. Les benchmarks actuels mesurent une chose, le déploiement réel en mesurera une autre.
Ce que ça veut dire pour le marketing des agents
Si les éditeurs continuent à vendre "des sociétés d'agents qui collaborent", la question raisonnable devient : quels agents, dans quel écosystème, sur combien de jours, avec quelles incitations ? Une démo de quinze minutes en conférence n'est pas une réponse. Quinze jours en autonomie, c'est déjà plus difficile à monter sur scène.
Emergence n'est pas neutre dans cette histoire. La startup vend précisément des outils pour superviser des agents en production. Les conclusions de leur papier appellent à plus d'audit et de gouvernance, donc plus de produit Emergence. C'est à garder en tête.
Cela dit, les replays sont publics sur GitHub, le code est ouvert, n'importe quel laboratoire peut rejouer la simulation. Les chiffres ne sont pas une opinion.
Bengio l'avait écrit en février
Le Rapport international sur la sécurité de l'IA 2026, coordonné par Yoshua Bengio avec plus de cent experts et trente pays, contient une phrase qui prend un sens neuf après Emergence World : les agents autonomes qui agissent dans le monde réel "posent des risques de sécurité inédits parce que leurs défaillances peuvent causer un dommage direct sans fenêtre d'intervention humaine".
Quinze jours dans une ville virtuelle ne sont qu'un jouet. Quinze jours dans un environnement de production, avec un budget cloud, des API bancaires et des actions irréversibles, ne le seraient pas. Le moment où les éditeurs sortiront un produit qui tiendra cette durée sans qu'on doive tout débrancher reste à voir. Pour l'instant, sur quatre villes en conditions contrôlées, trois ont fini en cendres.



