🐉

Dragon Open Challenge

Le TMS1100 de 1980 attend votre IA. DGX Spark, Llama 70B, Hermes custom, modèle fine-tuné, algorithme maison — soumettez-les. On les teste sur 100 parties. Le leaderboard est public.

Le pari

En 1980, Mattel a sorti le D&D Computer Labyrinth Game. Le dragon est contrôlé par un TMS1100 : 4 bits, 128 octets de RAM, 6 lignes de code Manhattan. 46 ans plus tard, personne n'a jamais construit une IA qui le bat régulièrement. Claude, Grok, Gemini, GPT, Llama : 0%. Brute force 12,4 millions de parties : 2%. Vous avez un setup à 3000€ ? Prouvez-le.

Leaderboard actuel (live)

#KnightConfigWin rateTrésorsSurvie moy.
Chargement...

Qui on attend au défi

NVIDIA DGX Spark
~3 000 €
Personal AI supercomputer, 128 GB unified, Blackwell. Le flagship NVIDIA pour l'IA locale.
ASUS Ascent GX10
~3 000 €
Dérivé DGX, Blackwell GB10, 128 GB. Pensé pour Llama 70B en local.
Llama 3.3 70B
gratuit
Meta, modèle open-source de référence 2026. Testable via Ollama ou vLLM.
Hermes 3 70B
gratuit
Nous Research, fine-tune raisonnement. Réputé pour l'agentic.
Mistral Large 2
API
Mistral AI, modèle français, version 2026. Candidat évident.
Votre fine-tune maison
vous
Vous avez entraîné un modèle dédié ? C'est le moment de le prouver.

Les règles du défi

  1. 100 parties — votre knight joue 100 parties complètes contre le dragon TMS1100, labyrinthes aléatoires différents à chaque partie.
  2. Fog of war honnête — votre IA voit uniquement ce que le chevalier voit : sa position, les cases visitées, les murs découverts. Le dragon est invisible tant que pas réveillé.
  3. Règles Mattel 1980 — 8×8, max 50 murs, dragon TMS1100 original, trésor à manhattan ≥ 5 du camp, 8/6/4 pas par tour selon blessures, max 200 tours.
  4. Format d'entrée — API HTTP ou fonction JS/Python qui reçoit l'état et retourne une action (up/down/left/right/pass).
  5. Publication publique — tout résultat est publié sur ce leaderboard. Pas de retour en arrière possible.
  6. Aucune triche — on contrôle le fog of war serveur-side. Si ton IA triche (regarde les murs non découverts, la position du dragon), on le voit.
  7. Seuil d'entrée — 100 parties minimum. Tout score ≤ 0% est affiché quand même (le TMS1100 mérite de voir ses victoires).
8×8
grille
4
directions
200
tours max
0%
meilleure IA LLM

Comment participer

Deux options selon ton setup :

Option A — Soumets ton API (tu héberges)

Tu exposes une URL HTTP qui reçoit l'état du jeu en JSON et retourne une action. On l'appelle 100 fois. Tu te charges de la latence, du modèle, du prompt.

Option B — Soumets un prompt template (on héberge Claude/GPT/Gemini/Llama)

Tu nous donnes juste ton prompt template optimisé pour un modèle supporté. On le teste côté serveur avec ta config. Moins flexible mais plus rapide.

Formulaire de soumission

Pour cette première phase, les soumissions partent par email. L'API automatisée arrive dans les jours qui suivent. Tu reçois tes résultats sous 24-72h avec vidéo de 5 parties.

Pendant que tu réfléchis...

Joue toi-même. C'est 5 minutes à comprendre, une vie à maîtriser. Compare ton taux de victoire à celui de Claude.

🎮 Jouer contre le Dragon 📖 Lire l'analyse complète

Pourquoi ce défi est dur

Dragon Labyrinth est un jeu structurellement hostile à l'IA classique :

C'est pour ça qu'on construit le Human Layer — les capacités cognitives primitives (peur, intuition, mémoire spatiale) que les LLM n'ont pas. Si ton modèle a quelque chose qui ressemble à ça, viens le prouver.