⚡ TL;DR — La règle simple
32 Go DDR5 = budget mini (7B-22B avec offload léger). 64 Go DDR5 = sweet spot (Mixtral 8x22B + Llama 70B Q2 utilisable, ~230€). 96 Go DDR5 = power users (multi-modèles, RAG long contexte, ~430€). 128 Go DDR5 = Mistral Large 3 et inférence CPU-only, attention piège AM5 (~620€). Et oui, DDR5 > DDR4 pour LLM, mais seulement en offload CPU.
Pourquoi la RAM compte autant que la VRAM
Tu as une RTX 4080 Super 16 Go. Tu charges Codestral 22B Q5 (17 Go). Que se passe-t-il ? Llama.cpp détecte que ton modèle déborde de 1 Go : il met les 50 premières layers sur le GPU, les 8 dernières sur la RAM CPU. Ce qui était censé fonctionner à 80 tok/s en VRAM pure tombe à 22-25 tok/s.
La RAM est là pour absorber l'overflow. C'est ton coussin de sécurité. Trop peu = tu plafonnes à 8B max. Assez = tu débloques 22B, 70B avec compromis. Beaucoup = tu peux te permettre les MoE et Mistral Large 3.
La RAM CPU est infiniment moins chère par Go que la VRAM GPU. 1 Go de VRAM coûte ~70€ (différentiel 4080 Super vs 4090). 1 Go de DDR5 coûte ~4€. Investir en RAM est ton levier le plus rentable pour gagner en capacité de modèles.
Le tableau RAM → LLM qu'il fallait
| RAM DDR5 | Modèles fluides (VRAM 12-16 Go) | Modèles avec offload | Hors portée |
|---|---|---|---|
| 16 Go | Mistral 7B Q4, Phi-3, Llama 8B Q4 | Aucun (pas de marge offload) | 22B+ frustrant, 70B impossible |
| 32 Go (sweet spot mini) | Tous les 7-8B Q5/Q8 | Mistral Small 22B Q4 (15-20 tok/s) | Mixtral 8x22B = compromis, 70B = lent |
| 64 Go (sweet spot) | Tous les 7-22B Q5 | Mixtral 8x22B Q4 (12-15 tok/s), Llama 70B Q2 (15-18 tok/s) | Mistral Large 3 = très lent |
| 96 Go (power user) | Multi-modèles simultanés possibles | Mixtral 8x22B Q5, Llama 70B Q4 (8-12 tok/s) | 200B+ très lent |
| 128 Go (extrême) | RAG long contexte, multi-instances | Mistral Large 3 (~4-6 tok/s), Llama 70B Q5 | Au-delà = serveur dédié |
Notes :
- "Fluide" = 30+ tok/s, pas de freeze
- "Avec offload" = utilisable mais avec layers CPU (vitesse réduite mais workable)
- Hors portée = soit techniquement impossible, soit si lent que ça ne sert à rien
Les 4 configurations recommandées
32 Go — Le minimum vital 2026
G.Skill Flare X5 DDR5-6000 CL30 32 Go (2x16)
Kit minimal moderne. AM5-optimisé EXPO. Idéal build entrée 1500€ avec RTX 3060 12 Go. Tu fais tourner tous les 7-8B + Mistral 22B avec offload léger.
✓ Testé sur Ryzen 5 7600 stable EXPO 6000 MT/s
64 Go — Le sweet spot
Corsair Vengeance DDR5-6000 64 Go (2x32)
Notre recommandation #1 pour build IA sérieux. 64 Go te permet de gérer l'offload de Mixtral 8x22B Q4 et Llama 70B Q2 confortablement. Le ratio prix/perf parfait.
✓ Notre testbench OutilsIA depuis 6 mois — stable 24/7 avec offload
96 Go — Power users
G.Skill Trident Z5 DDR5-6400 96 Go (2x48)
Format 2x48 Go = vitesse plein potentiel AM5 préservée. Tu débloques Mistral Large 3 (4-6 tok/s) et multi-modèles simultanés. Sweet spot pour développeur IA pro.
✓ Testé sur build PC IA OutilsIA, stable DDR5-6400 avec EXPO
128 Go — Extrême (attention piège AM5)
Kingston Fury Beast DDR5 128 Go (4x32)
Format 4x32 Go = pour Mistral Large 3 et inférence CPU-only. ATTENTION : sur AM5 (Ryzen 7000), les vitesses tombent à DDR5-3600/3800 avec 4 modules. Lire notre guide piège 128 Go AM5 avant d'acheter.
⚠️ Risque downclock 4x DIMM — vérifier QVL carte-mère obligatoire
Les pièges qu'on ne te dit pas
1. Le piège 128 Go sur AM5
Ryzen 7000 / 9000 sur AM5 supportent officiellement DDR5-5200 avec 4 modules (4 DIMMs). En pratique : tu achètes un kit 128 Go DDR5-6000, tu l'installes en 4 modules, tu démarres → ça boote en DDR5-3600 par sécurité. Tu perds 30-40% de bande passante.
Solution : prendre un kit 2x64 Go DDR5-6000 (rare en juin 2026) ou rester sur 96 Go en 2x48. Notre guide complet du piège 128 Go AM5 détaille les arnaques marketing.
2. DDR5 vs DDR4 pour LLM : la nuance
| Type | Bande passante | Impact LLM |
|---|---|---|
| DDR4-3200 (Ryzen 5000) | ~26 GB/s | Offload très lent |
| DDR4-3600 (Ryzen 5800X3D) | ~51 GB/s | Offload acceptable |
| DDR5-5200 (AM5 stock) | ~83 GB/s | Offload correct |
| DDR5-6000 (AM5 EXPO) | ~96 GB/s | Offload fluide |
| DDR5-6400 (AM5 sweet spot) | ~102 GB/s | Offload optimal |
Verdict : si tu fais souvent de l'offload (modèle > VRAM), DDR5 te donne 30-50% de vitesse en plus vs DDR4. Si ton modèle tient en VRAM pure, DDR4 vs DDR5 ne change rien.
3. Capacity vs Bandwidth : choisir
Budget 300€ : tu choisis entre :
- 64 Go DDR5-6000 CL30 (~230€) + 70€ ailleurs
- 64 Go DDR5-7200 CL34 (~300€) full speed
- 96 Go DDR5-6400 CL36 (~430€) = +130€ de plus
Pour LLM : la capacité bat la vitesse. Mieux vaut 96 Go DDR5-6000 que 64 Go DDR5-7200. Parce qu'un modèle qui rentre dans 96 Go ne rentrera pas dans 64 Go peu importe la vitesse. Et un modèle qui tient en RAM tourne — même un peu plus lentement.
Verdict par usage
🎯 Tu débutes en IA locale (premier build)
32 Go DDR5-6000 CL30 (~150€). Mistral 7B, Llama 8B, Phi-3 fluide. Tu peux upgrade à 64 Go plus tard sans changer la config. Le piège : ne PAS prendre 2x8 Go = tu seras bloqué.
🎯 Build IA sérieux (sweet spot)
64 Go DDR5-6000 CL30 (~230€). Notre recommandation #1. Tu peux faire l'offload Mixtral 8x22B Q4 confortablement, Llama 70B Q2 utilisable, multi-tâches IA possible. C'est notre testbench depuis 6 mois.
🎯 Power user / Dev pro
96 Go DDR5-6400 (~430€). Format 2x48 Go préserve la vitesse. Mistral Large 3 utilisable, multi-modèles simultanés, RAG long contexte, Stable Diffusion XL + LLM en parallèle. ROI 12-18 mois si tu vis de l'IA.
🎯 Inférence CPU-only ou Mistral Large 3 confort
128 Go DDR5-5600 (~620€). ATTENTION : sur AM5 tu vas perdre de la vitesse (downclock 4 DIMMs). Préfère un Threadripper si tu vises vraiment ça. Sinon 96 Go reste le plafond pratique AM5.
FAQ
32 Go suffit pour quoi ?
Tous les 7-8B fluides + Mistral 22B avec offload léger (15-20 tok/s). C'est le minimum vital 2026.
64 Go c'est vraiment le sweet spot ?
Oui. Mixtral 8x22B Q4 offload confortable, Llama 70B Q2 utilisable. ~230€ = ratio prix/perf optimal juin 2026.
96 Go c'est pour qui ?
Power users qui veulent Mixtral 8x22B Q5 confortable, Llama 70B Q4 fluide, multi-modèles, RAG long contexte. ~430€.
128 Go c'est overkill ?
Pas si tu vises Mistral Large 3 ou inférence CPU-only. ATTENTION piège AM5 : 4 DIMMs = downclock DDR5-3600. Préfère Threadripper.
DDR5 vs DDR4 important pour LLM ?
Oui pour offload CPU. DDR5-6000 = 96 GB/s vs DDR4-3600 = 51 GB/s. 30-50% plus rapide en offload.
Latence CAS (CL30, CL36) importante ?
Marginale. Bande passante > latence pour LLM. CL30 vs CL36 = 2-4% de diff. Privilégie fréquence stable haute.
Si je n'ai que 16 Go RAM ?
Mistral 7B Q4 / Llama 8B Q4 OK en VRAM. Mais zéro marge. Upgrade à 32 Go (~150€) = investissement le plus rentable.
🛒 Ton choix de RAM ?
Les 3 kits qu'on recommande, du sweet spot au confort total.
64 Go DDR5-6000 230€ 96 Go DDR5-6400 430€ 128 Go DDR5 620€Pour aller plus loin :
- 128 Go DDR5 sur AM5 : le piège à éviter — guide indispensable
- Build IA locale 1500€ liste Amazon — config entrée avec 32 Go
- RTX 4080 Super vs RTX 4090 — choisir le bon GPU
- Guide Mistral local complet
- Mémoire unifiée Mac vs PC — alternative Mac
Article publié le 7 juin 2026 par OutilsIA. Tests réalisés sur testbench Ryzen 9 7900X + RTX 4080 Super 16 Go + différents kits DDR5 (32 Go / 64 Go / 96 Go). Prix Amazon France juin 2026, sujets à variation. Liens d'affiliation (tag boiral21-21).