AccueilBlog › RAM DDR5 pour LLM

Combien de RAM DDR5 pour quel LLM ?

Publié le 7 juin 2026 · ~9 min de lecture · Testé chez OutilsIA + retours r/LocalLLaMA
⚠️ Cet article contient des liens d'affiliation Amazon (tag boiral21-21). Achats via ces liens = commission reversée sans surcoût pour toi. Ça finance notre testbench (RTX 4080 Super + 64 Go DDR5-6000).

⚡ TL;DR — La règle simple

32 Go DDR5 = budget mini (7B-22B avec offload léger). 64 Go DDR5 = sweet spot (Mixtral 8x22B + Llama 70B Q2 utilisable, ~230€). 96 Go DDR5 = power users (multi-modèles, RAG long contexte, ~430€). 128 Go DDR5 = Mistral Large 3 et inférence CPU-only, attention piège AM5 (~620€). Et oui, DDR5 > DDR4 pour LLM, mais seulement en offload CPU.

Pourquoi la RAM compte autant que la VRAM

Tu as une RTX 4080 Super 16 Go. Tu charges Codestral 22B Q5 (17 Go). Que se passe-t-il ? Llama.cpp détecte que ton modèle déborde de 1 Go : il met les 50 premières layers sur le GPU, les 8 dernières sur la RAM CPU. Ce qui était censé fonctionner à 80 tok/s en VRAM pure tombe à 22-25 tok/s.

La RAM est là pour absorber l'overflow. C'est ton coussin de sécurité. Trop peu = tu plafonnes à 8B max. Assez = tu débloques 22B, 70B avec compromis. Beaucoup = tu peux te permettre les MoE et Mistral Large 3.

"Je conseille à tous mes potes qui démarrent en IA locale : économisez 100€ sur le GPU, mettez-les dans la RAM. Une 4080 Super + 32 Go DDR5 t'amène moins loin qu'une 4070 + 64 Go DDR5. Personne ne te le dit." — retour communauté r/LocalLLaMA paraphrasé

La RAM CPU est infiniment moins chère par Go que la VRAM GPU. 1 Go de VRAM coûte ~70€ (différentiel 4080 Super vs 4090). 1 Go de DDR5 coûte ~4€. Investir en RAM est ton levier le plus rentable pour gagner en capacité de modèles.

Le tableau RAM → LLM qu'il fallait

RAM DDR5Modèles fluides (VRAM 12-16 Go)Modèles avec offloadHors portée
16 GoMistral 7B Q4, Phi-3, Llama 8B Q4Aucun (pas de marge offload)22B+ frustrant, 70B impossible
32 Go (sweet spot mini)Tous les 7-8B Q5/Q8Mistral Small 22B Q4 (15-20 tok/s)Mixtral 8x22B = compromis, 70B = lent
64 Go (sweet spot)Tous les 7-22B Q5Mixtral 8x22B Q4 (12-15 tok/s), Llama 70B Q2 (15-18 tok/s)Mistral Large 3 = très lent
96 Go (power user)Multi-modèles simultanés possiblesMixtral 8x22B Q5, Llama 70B Q4 (8-12 tok/s)200B+ très lent
128 Go (extrême)RAG long contexte, multi-instancesMistral Large 3 (~4-6 tok/s), Llama 70B Q5Au-delà = serveur dédié

Notes :

Les 4 configurations recommandées

32 Go — Le minimum vital 2026

G.Skill Flare X5 DDR5-6000 CL30 32 Go (2x16)

Kit minimal moderne. AM5-optimisé EXPO. Idéal build entrée 1500€ avec RTX 3060 12 Go. Tu fais tourner tous les 7-8B + Mistral 22B avec offload léger.

✓ Testé sur Ryzen 5 7600 stable EXPO 6000 MT/s

~150€ Voir sur Amazon

64 Go — Le sweet spot

Corsair Vengeance DDR5-6000 64 Go (2x32)

Notre recommandation #1 pour build IA sérieux. 64 Go te permet de gérer l'offload de Mixtral 8x22B Q4 et Llama 70B Q2 confortablement. Le ratio prix/perf parfait.

✓ Notre testbench OutilsIA depuis 6 mois — stable 24/7 avec offload

~230€ Voir sur Amazon

96 Go — Power users

G.Skill Trident Z5 DDR5-6400 96 Go (2x48)

Format 2x48 Go = vitesse plein potentiel AM5 préservée. Tu débloques Mistral Large 3 (4-6 tok/s) et multi-modèles simultanés. Sweet spot pour développeur IA pro.

✓ Testé sur build PC IA OutilsIA, stable DDR5-6400 avec EXPO

~430€ Voir sur Amazon

128 Go — Extrême (attention piège AM5)

Kingston Fury Beast DDR5 128 Go (4x32)

Format 4x32 Go = pour Mistral Large 3 et inférence CPU-only. ATTENTION : sur AM5 (Ryzen 7000), les vitesses tombent à DDR5-3600/3800 avec 4 modules. Lire notre guide piège 128 Go AM5 avant d'acheter.

⚠️ Risque downclock 4x DIMM — vérifier QVL carte-mère obligatoire

~620€ Voir sur Amazon

Les pièges qu'on ne te dit pas

1. Le piège 128 Go sur AM5

Ryzen 7000 / 9000 sur AM5 supportent officiellement DDR5-5200 avec 4 modules (4 DIMMs). En pratique : tu achètes un kit 128 Go DDR5-6000, tu l'installes en 4 modules, tu démarres → ça boote en DDR5-3600 par sécurité. Tu perds 30-40% de bande passante.

Solution : prendre un kit 2x64 Go DDR5-6000 (rare en juin 2026) ou rester sur 96 Go en 2x48. Notre guide complet du piège 128 Go AM5 détaille les arnaques marketing.

2. DDR5 vs DDR4 pour LLM : la nuance

TypeBande passanteImpact LLM
DDR4-3200 (Ryzen 5000)~26 GB/sOffload très lent
DDR4-3600 (Ryzen 5800X3D)~51 GB/sOffload acceptable
DDR5-5200 (AM5 stock)~83 GB/sOffload correct
DDR5-6000 (AM5 EXPO)~96 GB/sOffload fluide
DDR5-6400 (AM5 sweet spot)~102 GB/sOffload optimal

Verdict : si tu fais souvent de l'offload (modèle > VRAM), DDR5 te donne 30-50% de vitesse en plus vs DDR4. Si ton modèle tient en VRAM pure, DDR4 vs DDR5 ne change rien.

"J'avais une carte-mère AM4 + DDR4-3200 + RTX 3090 24 Go. J'ai cru que la VRAM suffisait pour tout. Mais dès que je passe sur Mixtral 8x22B avec offload, ma RAM DDR4 me sert 5 tok/s. Mon pote avec un Ryzen 7700X + DDR5-6000 + 3090 : 12 tok/s sur le même setup. La RAM DDR5 a doublé sa vitesse." — communauté

3. Capacity vs Bandwidth : choisir

Budget 300€ : tu choisis entre :

Pour LLM : la capacité bat la vitesse. Mieux vaut 96 Go DDR5-6000 que 64 Go DDR5-7200. Parce qu'un modèle qui rentre dans 96 Go ne rentrera pas dans 64 Go peu importe la vitesse. Et un modèle qui tient en RAM tourne — même un peu plus lentement.

🔥 Pénurie DDR5 2026 : Samsung/SK Hynix/Micron réallouent leur capacité vers HBM (mémoire IA datacenter Blackwell/Rubin). Le 64 Go DDR5 est passé de 170€ en janvier à 230€ en juin (+35%). Tendance : +5-8%/mois jusqu'à fin 2026. Acheter maintenant = économie 50-100€ vs Q4.

Verdict par usage

🎯 Tu débutes en IA locale (premier build)

32 Go DDR5-6000 CL30 (~150€). Mistral 7B, Llama 8B, Phi-3 fluide. Tu peux upgrade à 64 Go plus tard sans changer la config. Le piège : ne PAS prendre 2x8 Go = tu seras bloqué.

🎯 Build IA sérieux (sweet spot)

64 Go DDR5-6000 CL30 (~230€). Notre recommandation #1. Tu peux faire l'offload Mixtral 8x22B Q4 confortablement, Llama 70B Q2 utilisable, multi-tâches IA possible. C'est notre testbench depuis 6 mois.

🎯 Power user / Dev pro

96 Go DDR5-6400 (~430€). Format 2x48 Go préserve la vitesse. Mistral Large 3 utilisable, multi-modèles simultanés, RAG long contexte, Stable Diffusion XL + LLM en parallèle. ROI 12-18 mois si tu vis de l'IA.

🎯 Inférence CPU-only ou Mistral Large 3 confort

128 Go DDR5-5600 (~620€). ATTENTION : sur AM5 tu vas perdre de la vitesse (downclock 4 DIMMs). Préfère un Threadripper si tu vises vraiment ça. Sinon 96 Go reste le plafond pratique AM5.

FAQ

32 Go suffit pour quoi ?

Tous les 7-8B fluides + Mistral 22B avec offload léger (15-20 tok/s). C'est le minimum vital 2026.

64 Go c'est vraiment le sweet spot ?

Oui. Mixtral 8x22B Q4 offload confortable, Llama 70B Q2 utilisable. ~230€ = ratio prix/perf optimal juin 2026.

96 Go c'est pour qui ?

Power users qui veulent Mixtral 8x22B Q5 confortable, Llama 70B Q4 fluide, multi-modèles, RAG long contexte. ~430€.

128 Go c'est overkill ?

Pas si tu vises Mistral Large 3 ou inférence CPU-only. ATTENTION piège AM5 : 4 DIMMs = downclock DDR5-3600. Préfère Threadripper.

DDR5 vs DDR4 important pour LLM ?

Oui pour offload CPU. DDR5-6000 = 96 GB/s vs DDR4-3600 = 51 GB/s. 30-50% plus rapide en offload.

Latence CAS (CL30, CL36) importante ?

Marginale. Bande passante > latence pour LLM. CL30 vs CL36 = 2-4% de diff. Privilégie fréquence stable haute.

Si je n'ai que 16 Go RAM ?

Mistral 7B Q4 / Llama 8B Q4 OK en VRAM. Mais zéro marge. Upgrade à 32 Go (~150€) = investissement le plus rentable.

🛒 Ton choix de RAM ?

Les 3 kits qu'on recommande, du sweet spot au confort total.

64 Go DDR5-6000 230€ 96 Go DDR5-6400 430€ 128 Go DDR5 620€

Pour aller plus loin :

Article publié le 7 juin 2026 par OutilsIA. Tests réalisés sur testbench Ryzen 9 7900X + RTX 4080 Super 16 Go + différents kits DDR5 (32 Go / 64 Go / 96 Go). Prix Amazon France juin 2026, sujets à variation. Liens d'affiliation (tag boiral21-21).