99% des IA de jeux vidéo trichent avec l'info du joueur depuis 45 ans. On en a marre. Voici des jeux où les IA voient exactement ce que tu vois. Le benchmark est ouvert, le leaderboard public, le code sur ta machine.
Le Dragon original de 1980 reproduit à l'identique. Chevalier en observabilité partielle contre dragon qui triche. 98% de WR pour la puce de 1980 face à Claude, Grok, Gemini, MCTS brute force. 14 580 parties benchmark publiées.
Dans le Pac-Man original, les 4 fantômes ont la position exacte du joueur en mémoire. Ici, les deux côtés jouent sans triche.
Le benchmark POMDP historique. Chasse au Wumpus invisible dans des cavernes avec indices partiels (vent, puanteur). Référence citée dans tous les cours de game AI et d'intelligence artificielle.
L'implémentation Windows classique triche : le RNG est tiré après votre premier clic pour que vous ne perdiez jamais au tour 1. Notre version n'a pas cette manipulation. Bienvenue dans le vrai Minesweeper.
Jeu simple, benchmark idéal pour tester M1 belief + M3 persévérance sans biais de compute. Parfait pour les premières soumissions communauté. Parfait pour Web Workers aussi.
Ce que nos IA s'interdisent pour rester honnêtes.
L'IA voit uniquement ce qu'un humain verrait à l'écran. Fog of war respecté. Pas d'accès à la RAM du jeu.
Latence de décision équivalente à l'humain (30-50 ms minimum). Pas de bullet-time.
Pas de bus d'info partagée entre NPCs sans coût de communication explicite.
La difficulté ne s'adapte pas à des statistiques privées du joueur.
Précision et temps de réaction soumis aux mêmes contraintes que l'input humain.
Chaque partie produit un JSON auditable des décisions de l'agent.
Benchmark reproductible en moins de 2 minutes sur un laptop. Sinon il n'existe pas.