Sélectionnez votre GPU et votre RAM, découvrez instantanément quels modèles IA tournent : Llama 4, Qwen 3, DeepSeek R1, Mistral Large 3, Stable Diffusion, Flux.
Pour une IA locale en 2026 : 8 Go VRAM minimum (Llama 4 Scout, Qwen 3 8B), 12-16 Go confortable (Qwen 3 14B, DeepSeek Distill 14B), 24 Go excellent (Qwen 3 32B, Llama 3.3 70B Q4 partiel), 48 Go+ pour Llama 70B en pleine vitesse. Les Mac M4 avec mémoire unifiée sont une excellente alternative pour les très gros modèles.
💰 Prix actuel
Voir le prix réel sur Amazon (mise à jour quotidienne)
Estimations basées sur la bande passante mémoire ( GB/s) × efficacité %. Approximations à ±25%. MoE = vitesse sur les params actifs par token (souvent 5-10× plus rapide qu'un dense équivalent), taille totale doit tenir en mémoire.
| Modèle | Q4 | Q8 | FP16 |
|---|---|---|---|
Selon ta config et tes priorités, le configurateur Premium calcule 3 builds optimisés avec analyse complète :
| VRAM | Modèles IA confortables | GPU recommandé | Budget |
|---|---|---|---|
| 8 Go | Llama 4 Scout 17B Q4, Qwen 3 7B, Phi-4 8B, Mistral 7B | RTX 4060 8GB, RTX 3060 Ti | 300-400€ |
| 12 Go | Qwen 3 14B, DeepSeek Distill 14B, Phi-4 14B | RTX 3060 12GB, RTX 4070 | 300-600€ |
| 16 Go | Qwen 3 14B Q8, Llama 4 Scout Q8, Gemma 3 27B Q4 | RTX 4060 Ti 16GB, RTX 4070 Ti Super | 450-900€ |
| 24 Go | Qwen 3 32B, DeepSeek Distill 32B, Mistral Large 3 partiel | RTX 3090 24GB, RTX 4090, RX 7900 XTX | 700-1900€ |
| 32 Go | Llama 3.3 70B Q3, Qwen 3 72B Q3, Llama 4 Maverick | RTX 5090 32GB | 2200-2700€ |
| 48 Go | Llama 3.3 70B Q4, Qwen 3 72B Q4 | 2x RTX 3090, Mac Mini M4 Pro 48GB | 1400-2500€ |
| 96 Go | Mistral Large 3 Q4, Llama 4 Maverick Q8 | RTX Pro 6000 Blackwell, Mac Studio M4 Max | 5000-9000€ |
| 192 Go+ | DeepSeek R1 671B Q3, Llama 4 Behemoth 288B | Mac Studio M4 Ultra 192GB, multi-H100 | 8000€+ |
C'est LA question que tout le monde se pose avant d'installer Ollama, LM Studio ou ComfyUI. La réponse dépend principalement de votre carte graphique (GPU) et de sa mémoire vidéo (VRAM).
En 2026, le paysage IA locale a explosé : Llama 4 (Scout 17B, Maverick 109B MoE, Behemoth 288B), Qwen 3 (jusqu'à 235B Mixture-of-Experts), DeepSeek R1 671B avec ses versions distillées, Mistral Large 3, Gemma 3, Phi-4. Côté hardware, la RTX 5090 32GB Blackwell est arrivée, les Mac M4 avec mémoire unifiée jusqu'à 192GB ouvrent l'IA locale aux modèles 70B+, et l'AMD RX 9070 XT rattrape NVIDIA sur le rapport perf/prix.
En règle générale avec une quantification Q4 (bon compromis qualité/taille) :
Le modèle peut utiliser la RAM système (CPU offloading) mais c'est beaucoup plus lent (5-10x). C'est utilisable pour tester mais pas pour un usage quotidien confortable. La meilleure solution : upgrader votre GPU ou passer sur un Mac avec mémoire unifiée (M4 Pro 48GB est devenu en 2026 un excellent rapport qualité/prix pour les modèles 30-70B).
Les Mac M4 brillent sur les très gros modèles grâce à la mémoire unifiée (le GPU Apple peut adresser jusqu'à 192GB sur Mac Studio M4 Ultra). Mais les PC RTX gardent un avantage de vitesse pure (tokens/seconde) sur les modèles 7-32B. Choisissez Mac pour Llama 70B+ silencieux, PC RTX pour Qwen 3 32B ultra-rapide.
Guide : meilleur GPU IA locale 2026 → | Mac vs PC pour l'IA → | RTX Pro 6000 96GB → | Upgrade Advisor →
Configurateur complet : 3 builds alternatifs (silencieux / puissance / value), projection IA workloads détaillée par modèle, analyse bottleneck approfondie, PDF shopping list avec liens marchands. Sois prévenu·e du lancement.
OutilsIA collabore avec Strategy Arena Research sur des benchmarks et papers ouverts (Dragon Labyrinth, calibration LLMs, agents POMDP). Datasets en CC-BY 4.0.