🎮 Benchmarks IA ludiques — sans triche

Des jeux où les IA jouent
à info symétrique

99% des IA de jeux vidéo trichent avec l'info du joueur depuis 45 ans. On en a marre. Voici des jeux où les IA voient exactement ce que tu vois. Le benchmark est ouvert, le leaderboard public, le code sur ta machine.

La galerie

🐉
✓ LIVE

Dragon Labyrinth

Mattel 1981 · TMS1100 · POMDP 8×8

Le Dragon original de 1980 reproduit à l'identique. Chevalier en observabilité partielle contre dragon qui triche. 98% de WR pour la puce de 1980 face à Claude, Grok, Gemini, MCTS brute force. 14 580 parties benchmark publiées.

Ablation M1/M2/M3 Grid search 729 configs MCTS + Layers
Jouer maintenant →
👻
🔜 BIENTÔT

Pac-Man Symmetric

Double challenge MARL · POMDP multi-agent · Problème ouvert 2026

Dans le Pac-Man original, les 4 fantômes ont la position exacte du joueur en mémoire. Ici, les deux côtés jouent sans triche.

🎮 Défi #1 — IA Pac-Man
Multi-objectifs (pellets, survie, power), anticipation 4 trajectoires, timing. Record IA 2017 : 19k pts. Record humain : 920k. ×48 d'écart.
👻 Défi #2 — 4 fantômes honnêtes (MARL)
Search in POMDP + coopération sans bus d'info gratuit. Problème de recherche ouvert. 3 modes comm : Silent, Token-limited, Open radio.
🏆 3 leaderboards inédits
Best Pac-Man / Best Ghost Team / Cross-Match (Pac-Man d'un auteur vs fantômes d'un autre). Le #3 n'existe nulle part ailleurs.
Paper à venir : "The Cost of Honesty — mesurer le coût de la coordination sans triche d'info"
🕳️
💡 IDÉE

Wumpus World

Yob 1973 · POMDP académique classique

Le benchmark POMDP historique. Chasse au Wumpus invisible dans des cavernes avec indices partiels (vent, puanteur). Référence citée dans tous les cours de game AI et d'intelligence artificielle.

💣
💡 IDÉE

Minesweeper Honest

Microsoft 1989 · Version non truquée

L'implémentation Windows classique triche : le RNG est tiré après votre premier clic pour que vous ne perdiez jamais au tour 1. Notre version n'a pas cette manipulation. Bienvenue dans le vrai Minesweeper.

🐍
💡 IDÉE

Snake no-cheat

Nokia 1997 · IA pure sans avantage

Jeu simple, benchmark idéal pour tester M1 belief + M3 persévérance sans biais de compute. Parfait pour les premières soumissions communauté. Parfait pour Web Workers aussi.

📜 Notre engagement

Les 7 règles Fair Play

Ce que nos IA s'interdisent pour rester honnêtes.

1. Same vision

L'IA voit uniquement ce qu'un humain verrait à l'écran. Fog of war respecté. Pas d'accès à la RAM du jeu.

2. Same clock

Latence de décision équivalente à l'humain (30-50 ms minimum). Pas de bullet-time.

3. No telemetry

Pas de bus d'info partagée entre NPCs sans coût de communication explicite.

4. No rubber banding

La difficulté ne s'adapte pas à des statistiques privées du joueur.

5. No aimbot

Précision et temps de réaction soumis aux mêmes contraintes que l'input humain.

6. Public decision logs

Chaque partie produit un JSON auditable des décisions de l'agent.

7. Open protocol

Benchmark reproductible en moins de 2 minutes sur un laptop. Sinon il n'existe pas.

📖 La série Dragon Labyrinth