Qu'est-ce que MemPalace ?

MemPalace est un système de mémoire persistante pour IA créé par Milla Jovovich et Ben Sigman. Il utilise une architecture de palais de la mémoire (wings, rooms, halls) avec compression AAAK 30x et stockage SQLite local. Score de 96.6% sur LongMemEval.

Comment installer MemPalace ?

Installation en 4 commandes : pip install mempalace, mempalace init, mempalace mine (pour importer vos chats existants), puis mempalace wake-up pour charger le contexte critique en ~170 tokens.

MemPalace est-il gratuit ?

Oui, MemPalace est entièrement gratuit et open source sous licence MIT. Il fonctionne en local sans cloud, sans API payante, avec SQLite comme seule base de données.

Quelle est la différence entre MemPalace et RAG ?

RAG classique charge ~4000 tokens de chunks non compressés. MemPalace charge ~170 tokens de contexte compressé (AAAK 30x) qui couvrent des mois d'historique. MemPalace atteint 96.6% sur LongMemEval contre ~73% pour le RAG classique.

MemPalace fonctionne-t-il avec des LLM locaux ?

Oui, MemPalace fonctionne avec Claude, GPT, Llama, Mistral, Hermes et tout LLM compatible. Il s'intègre via MCP (19 outils) avec Claude, Cursor et ChatGPT. Tout fonctionne en local sans connexion internet.

Accueil › Blog › MemPalace — Milla Jovovich

🎬 Viral — IA & Hollywood

MemPalace : Milla Jovovich crée le meilleur système de mémoire IA au monde

Q: Milla Jovovich a-t-elle vraiment créé MemPalace ?

Oui. Milla Jovovich, l'actrice de Resident Evil et Le Cinquième Élément, a co-créé MemPalace avec Ben Sigman (@bensig). Elle travaillait sur un projet de jeu vidéo et a été frustrée par l'incapacité de l'IA à se souvenir. Le repo a atteint 4 600 stars GitHub en quelques heures.

Et c'est gratuit, open source, local. 4 600 stars GitHub en quelques heures.

Par l'équipe OutilsIA • 7 avril 2026 • 20 min de lecture

🌟

Trending #1 sur GitHub

4 600 ★ en quelques heures

L'actrice de Resident Evil et Le Cinquième Élément vient de publier un outil d'IA qui surpasse tous les systèmes de mémoire payants. Internet est en ébullition.

« L'IA est terrible pour retrouver des choses. J'ai passé des mois à organiser mes fichiers pour un projet de jeu, et chaque fois que je relançais Claude ou ChatGPT, il avait tout oublié. Alors j'ai décidé de construire moi-même la solution. » — Milla Jovovich

Oui, vous avez bien lu. Milla Jovovich — Alice dans Resident Evil, Leeloo dans Le Cinquième Élément, supermodèle, musicienne — vient de publier le meilleur système de mémoire IA jamais créé. Et il est gratuit, open source, et entièrement local.

Le 7 avril 2026, le repo github.com/milla-jovovich/mempalace a explosé avec 4 600 stars en quelques heures. Les mèmes sur Umbrella Corporation envahissent Twitter. Mais derrière le buzz, la technologie est réellement révolutionnaire.

96.6% sur le benchmark LongMemEval. Compression AAAK 30x sans perte. 19 outils MCP. SQLite local. Zéro cloud. Zéro coût d'API. Licence MIT. Dans cet article, on décortique tout.

🎬 L'actrice de Resident Evil qui code mieux que les devs IA

L'histoire commence comme un scénario de film — ce qui est logique pour une star hollywoodienne.

La timeline virale

Début 2026

Milla travaille sur un projet de jeu vidéo ambitieux. Elle utilise Claude et ChatGPT pour organiser le game design, les dialogues, le lore.

La frustration

Chaque nouvelle session, l'IA a tout oublié. Milla passe des heures à ré-expliquer son projet. « C'est comme avoir un assistant avec Alzheimer », dit-elle.

La rencontre avec Ben Sigman

@bensig, développeur et entrepreneur tech, partage la même frustration. Ensemble, ils décident de construire la solution.

7 avril 2026 — Le lancement

MemPalace est publié sur GitHub. En quelques heures : 4 600 stars. Trending #1. Les mèmes sur « Umbrella Corp lance un projet IA » inondent les réseaux sociaux.

🎬

Milla Jovovich

Actrice, productrice, créatrice de MemPalace. Oui, vraiment.

💻

Ben Sigman (@bensig)

Co-créateur, développeur principal, architecte technique.

⚡

4 600 ★

Stars GitHub en quelques heures. Le repo le plus viral d'avril 2026.

Ce qui rend cette histoire incroyable, ce n'est pas qu'une célébrité ait créé un outil tech. C'est que l'outil est objectivement meilleur que tout ce qui existe. Pas un gadget marketing. Un outil qui bat les benchmarks, qui est gratuit, et qui fonctionne entièrement en local.

Les développeurs IA du monde entier sont passés de « lol une actrice qui code » à « attendez, ce score LongMemEval est réel ?! » en environ 30 secondes.

😴 Le problème que tout le monde a

Soyons honnêtes : chaque IA oublie tout à chaque session. Et c'est insupportable.

💔 La réalité quotidienne

✗

Vous expliquez votre projet pour la 100ème fois

✗

L'IA vous suggère une approche que vous avez déjà testée et rejetée la semaine dernière

✗

Vous perdez 20 minutes à recontextualiser avant chaque session

✗

Vos décisions passées, vos préférences, votre historique — tout disparaît

Les solutions existantes ? Insuffisantes :

RAG classique

Mieux que rien, mais c'est juste une « recherche dans des morceaux de texte ». Pas de vraie compréhension, pas de compression, pas de structure. Score : ~73% sur LongMemEval.

→ Notre guide RAG local

Outils payants (Mem0, Zep...)

Coûteux, dépendants du cloud, données envoyées chez des tiers. Et les scores LongMemEval sont inférieurs à MemPalace.

LLM Wiki (Karpathy)

Bonne approche de « connaissances compilées », mais pas de compression, pas de persistance longue durée structurée. Score : ~85%.

→ Notre article LLM Wiki

Mémoire native (ChatGPT, Claude)

Limitée, non structurée, pas de compression, impossible à exporter ou contrôler.

Ce qu'il nous faut, c'est une vraie mémoire persistante qui dure des mois, des années. Qui se compresse intelligemment. Qui fonctionne en local. C'est exactement ce que MemPalace fait.

🏠 MemPalace : comment ça marche

Le nom n'est pas un hasard. MemPalace s'inspire du palais de la mémoire (method of loci), une technique de mémorisation utilisée depuis les Grecs anciens. L'idée : organiser les souvenirs dans un bâtiment mental, avec des pièces, des couloirs et des tiroirs.

MemPalace applique cette métaphore à l'IA, mais avec une rigueur technique impressionnante :

Architecture du Palais de la Mémoire

🏰 MEMPALACE

🔮 Wing : Projet IA

🚪 Room : GPU Config

Hall: Faits Hall: Décisions Hall: Conseils

🚪 Room : RAG Pipeline

Hall: Faits Hall: Erreurs

🔮 Wing : Client A

🚪 Room : Préférences

Hall: Faits Hall: Événements

🚪 Room : Historique

Hall: Événements Hall: Décisions

🔨 Tunnels (liens entre idées)

GPU Config ↔ RAG Pipeline ↔ Préférences Client A

Comme des backlinks dans un wiki — chaque idée est connectée

🗃 Closets + Drawers (stockage)

Closet = résumé compressé AAAK (30x)

Drawer = contenu brut verbatim (jamais modifié)

Les 5 concepts clés

🔮

Wings (Ailes)

Les grandes catégories : personnes, projets, domaines. Comme les ailes d'un château.

🚪

Rooms (Pièces)

Les sujets spécifiques dans un projet. « GPU Config », « Ollama Setup », « RAG Pipeline ».

🏛

Halls (Couloirs)

Les types de mémoire : faits, événements, conseils, décisions, erreurs.

🔨

Tunnels (Liens)

Les connexions entre idées, comme des backlinks dans un wiki. Permettent la navigation associative.

🗃

Closets + Drawers (Placards + Tiroirs)

Closets : résumés compressés (AAAK, 30x). Drawers : contenu brut verbatim, jamais modifié. Vous pouvez toujours retrouver l'original.

Le génie de cette architecture : elle est intuitive pour les humains (on pense naturellement en « pièces » et « tiroirs ») et efficace pour les LLM (navigation structurée, compression optimale, graphe de connaissances SQLite).

Tout est stocké dans une base SQLite locale. Pas de serveur, pas de cloud, pas de base vectorielle complexe. Un seul fichier sur votre disque.

💥 AAAK : la compression magique

C'est le coeur technique de MemPalace, et c'est ce qui le rend si supérieur à tout le reste.

AAAK = 30x compression sans perte

1 000

tokens en entrée

Une conversation complète

~120

tokens en sortie

Tout le contexte préservé

RAG classique ~4 000 tokens

MemPalace wake-up ~170 tokens

RAG charge ~4 000 tokens de chunks bruts. MemPalace charge ~170 tokens de TOUT votre historique.

Pourquoi c'est révolutionnaire :

✓

Sans perte : n'importe quel LLM peut lire directement le format AAAK. Le contenu brut est toujours accessible dans les Drawers.

✓

Des mois en 170 tokens : vous pouvez charger l'intégralité de votre historique de travail dans le prompt système d'un LLM.

✓

Universellement compatible : fonctionne avec Claude, GPT, Llama, Mistral, Hermes, et tout autre LLM.

✓

Zéro coût additionnel : 170 tokens coûtent quasiment rien, même sur les APIs payantes.

📈 Les benchmarks qui font le buzz

Ce n'est pas du marketing. Ce sont des chiffres vérifiables sur le benchmark LongMemEval, la référence industrielle pour évaluer la mémoire à long terme des systèmes IA.

MemPalace sur LongMemEval

96.6%

Score brut (sans API, juste ChromaDB + Palace)

Le meilleur score jamais atteint pour un outil gratuit/local

100%

Avec rerank léger

Score parfait — jamais atteint par aucun autre outil

Système	Structure	Compression	LongMemEval	Coût	Local
🏆 MemPalace	Wings / Rooms / Halls	AAAK 30x	96.6%	Gratuit	✓
Mem0	Key-value + graphe	Aucune	~88%	Payant	Partiel
Zep	Sessions + faits	Aucune	~82%	Payant	✗
LLM Wiki (Karpathy)	Markdown wiki	Aucune	~85%	Gratuit	✓
RAG classique	Chunks + vecteurs	Aucune	~73%	Variable	Partiel

Sources : benchmarks LongMemEval publiés, README MemPalace. Les scores des concurrents sont des estimations basées sur les rapports disponibles.

Le point clé : MemPalace atteint 96.6% sans aucun appel API, juste avec ChromaDB et la structure Palace. Avec un léger rerank, il atteint 100% — un score parfait que personne d'autre n'a jamais atteint.

Et contrairement à Mem0 et Zep, c'est gratuit, open source, et entièrement local. Vos données ne quittent jamais votre machine.

⚡ Installer MemPalace en 5 minutes

L'installation est d'une simplicité désarmante. Quatre commandes et c'est fini.

Installation rapide

# Étape 1 : Installer MemPalace

$ pip install mempalace

# Étape 2 : Initialiser votre palais

$ mempalace init

✓ Palace initialisé dans ~/.mempalace/palace.db

# Étape 3 : Miner vos chats existants

$ mempalace mine

✓ 247 souvenirs extraits de vos conversations

# Étape 4 : Charger le contexte critique

$ mempalace wake-up

✓ Contexte chargé : 247 souvenirs → 170 tokens (AAAK 30x)

Compatibilité

LLM compatibles

✓ Claude (Anthropic)

✓ GPT-4 / ChatGPT

✓ Llama 3 / 4 (Meta)

✓ Mistral / Mixtral

✓ Hermes (Nous Research)

✓ Tout modèle via Ollama

Intégrations MCP

⚙ 19 outils MCP

✓ Claude Desktop

✓ Cursor

✓ ChatGPT (via plugins)

✓ Open WebUI

Stockage

🗃 SQLite local (zéro cloud)

🔒 Zéro API, zéro coût

🌐 Fonctionne hors ligne

💡

Licence MIT — Gratuit pour toujours

MemPalace est sous licence MIT. Vous pouvez l'utiliser, le modifier, le redistribuer sans aucune restriction. Pas de freemium, pas de piège. Gratuit pour toujours.

⚖ MemPalace vs RAG vs LLM Wiki : l'évolution de la mémoire IA

Pour comprendre pourquoi MemPalace est un saut générationnel, il faut replacer les choses dans leur contexte historique.

Les 3 ères de la mémoire IA

🅴re 1 : RAG classique (2023-2024)

Découper les documents en chunks, les vectoriser, chercher par similarité. Simple mais brutal : pas de compression, pas de structure, pas de contexte à long terme.

~4 000 tokens chargés ~73% LongMemEval

→ Notre guide RAG local avec Ollama

🅵re 2 : LLM Wiki / Agentic RAG (2025)

L'IA compile les connaissances dans un wiki structuré (Karpathy). L'Agentic RAG ajoute une couche de raisonnement. Mieux, mais pas de compression, pas de persistance sur des mois.

Fichiers markdown ~85% LongMemEval

→ LLM Wiki : knowledge engineering | Guide Agentic RAG

🅶re 3 : MemPalace (2026) 🌟

Architecture Palace (wings/rooms/halls) + compression AAAK 30x + graphe SQLite local. Le saut : des mois de contexte en ~170 tokens. Mémoire persistante, structurée, compressée.

~170 tokens chargés 96.6% LongMemEval 100% avec rerank

La différence fondamentale : RAG vous donne des morceaux de texte. LLM Wiki vous donne des connaissances compilées. MemPalace vous donne une mémoire vivante, compressée et structurée qui évolue avec le temps.

🎮 Démo interactive : explorez un Memory Palace

Cliquez sur les ailes, pièces et couloirs pour explorer la structure d'un palais de mémoire IA. Observez la compression AAAK en action.

Souvenirs

247

Compression

30x

Tokens contexte

170 tokens

🏰 Explorez le palais — cliquez sur une aile

Avant / Après MemPalace

💻 Quel hardware pour MemPalace

MemPalace lui-même est ultra léger — il tourne sur n'importe quoi (SQLite, pas de GPU requis pour la mémoire). Mais le LLM qui utilise cette mémoire a besoin de puissance GPU.

Voici nos recommandations par niveau :

🥇

Niveau 1 — Agent mémoire basique

Pour débuter avec MemPalace

RTX 3060 12 Go

Hermes 8B / Llama 8B en Q4. Suffisant pour un palais de ~500 souvenirs.

🛒 Voir sur Amazon →

Config recommandée

32 Go RAM, SSD NVMe, CPU récent. Ubuntu 22.04 ou Windows 11 WSL2.

🥈

Niveau 2 — Agent mémoire sérieux

Notre recommandation

RTX 4090 24 Go

Hermes 70B Q4 / Llama 70B Q4. Palais illimité, réponses rapides.

🛒 Voir sur Amazon →

Config recommandée

64 Go RAM, SSD NVMe 2 To, Ryzen 7 / i7. Le sweet spot pour l'IA locale.

🛒 RAM 64 Go sur Amazon →

🏆

Niveau 3 — Agent mémoire ultime

Performance maximale

RTX PRO 6000 96 Go (Blackwell)

N'importe quel modèle 70B en Q8 ou même 120B. Le monstre absolu pour l'IA locale.

→ Notre article complet RTX PRO 6000

Config recommandée

128 Go RAM, PSU 1000W, boîtier ventilé. C'est un investissement pro.

🛒 Alimentation 1000W sur Amazon →

🍏

Option Mac — Agent mémoire élégant

Écosystème Apple

Mac Studio M4 Ultra

Mémoire unifiée 192 Go. Silencieux, compact, idéal pour un setup bureau.

🛒 Voir sur Amazon →

Avantages

Silencieux, basse consommation, mémoire unifiée. Parfait pour un bureau sans bruit de ventilateur.

🚀 Pourquoi c'est un game changer pour l'IA locale

Avant MemPalace, votre IA locale était puissante mais amnésique. Après MemPalace, elle se souvient de tout, pour toujours.

Cas d'usage concrets

💻

Assistant de code

Se souvient de l'intégralité de l'historique de votre codebase. Sait quels bugs vous avez corrigés, quelles architectures vous avez rejetées, quelles conventions vous préférez.

👤

Assistant personnel

Connaît vos préférences depuis des années. Votre style de communication, vos habitudes, vos projets en cours. Un vrai assistant, pas un perroquet.

📚

Agent de recherche

Accumule les connaissances entre les sessions. Chaque recherche enrichit le palais. Après 3 mois, votre agent en sait plus que vous sur votre domaine.

💼

Agent business / CRM

Suit l'historique client complet. Préférences, décisions, échanges. Chaque interaction est enrichie par les précédentes.

📈

Agent trading

Mémoire persistante pour les stratégies, les patterns détectés, les erreurs passées. Parfait pour les agents de trading avec mémoire à long terme.

🎓

Tuteur IA

Se souvient de ce que l'élève maîtrise et de ses difficultés. Adapte l'enseignement au fil des mois. Véritable apprentissage personnalisé.

💡 L'association qui tue

MemPalace + Ollama + Open WebUI = un ChatGPT privé avec mémoire infinie, entièrement sur votre machine.

Zéro donnée envoyée au cloud. Zéro abonnement. Mémoire persistante pour des années. C'est le setup ultime pour l'IA locale en 2026.

🔮 Le futur : agents avec mémoire infinie

MemPalace n'est pas juste un outil isolé. C'est la pièce manquante d'un écosystème qui se construit sous nos yeux.

Les combinaisons du futur

MemPalace + Karpathy AutoResearch

Des agents qui s'améliorent automatiquement ET se souviennent de chaque expérience. Chaque nuit d'AutoResearch enrichit le palais.

MemPalace + LLM Wiki

Connaissances structurées (wiki) + mémoire persistante compressée (palais). Le meilleur des deux mondes.

→ Notre guide LLM Wiki

MemPalace + Agentic RAG

Récupération intelligente avec raisonnement (Agentic RAG) + contexte à long terme (MemPalace). L'agent ne cherche pas juste — il comprend le contexte historique.

→ Notre guide Agentic RAG

« Nous entrons dans l'ère de l'IA qui vous connaît vraiment. Pas une IA qui fait semblant de se souvenir, mais une IA qui accumule, compresse et structure vos interactions sur des mois, des années. MemPalace est la première brique crédible de cette vision. »

Et le plus beau dans tout ça ? C'est une actrice de cinéma d'action qui a montré la voie. Comme quoi, la frustration d'un utilisateur vaut parfois plus que des années de recherche académique.

⚡ Résumé : commencez en 60 secondes

$ pip install mempalace

$ mempalace init

$ mempalace mine

$ mempalace wake-up

★ GitHub — MemPalace Licence MIT — Gratuit pour toujours — 4 600+ stars

❓ Questions fréquentes (FAQ)

Milla Jovovich a-t-elle vraiment créé MemPalace ?

Oui. Milla Jovovich (Resident Evil, Le Cinquième Élément) a co-créé MemPalace avec Ben Sigman (@bensig). Elle travaillait sur un projet de jeu vidéo et était frustrée par l'amnésie des IA. Le repo GitHub est sous son nom : github.com/milla-jovovich/mempalace.

MemPalace est-il vraiment gratuit ?

Oui, licence MIT. Gratuit pour toujours, pour un usage personnel ou commercial. Pas de freemium, pas de limitations cachées.

Ai-je besoin d'un GPU pour MemPalace ?

Non. MemPalace lui-même fonctionne sur CPU (SQLite + compression). Mais le LLM qui utilise la mémoire a généralement besoin d'un GPU. Si vous utilisez une API cloud (Claude, GPT), aucun GPU local n'est nécessaire.

Quelle est la différence entre MemPalace et la mémoire native de ChatGPT/Claude ?

La mémoire native est limitée, non structurée et impossible à exporter. MemPalace offre une architecture Palace complète (wings/rooms/halls), une compression AAAK 30x, et un stockage SQLite local que vous contrôlez entièrement.

Qu'est-ce que la compression AAAK ?

AAAK est le format de compression propriétaire de MemPalace. Il compresse 1 000 tokens en ~120 tokens (30x) sans perte sémantique. N'importe quel LLM peut lire directement le format compressé. Le contenu brut reste accessible dans les Drawers.

Combien de souvenirs MemPalace peut-il stocker ?

Pas de limite technique. SQLite peut gérer des millions d'entrées. La compression AAAK signifie que même des années d'historique se chargent en ~170 tokens via mempalace wake-up.