⚡ TL;DR
Le Moore Threads MTT S90 est le premier GPU chinois à rivaliser sérieusement avec la RTX 4060 en gaming (+9% Steel Nomad, parité Naraka 4K). Derrière lui, quatre fabricants chinois (les "Four Little Dragons") contrôlent maintenant 60% du marché GPU domestique — NVIDIA n'a plus que 8% en Chine. Mais pour l'IA locale, c'est niet : pas de CUDA, pas de PyTorch natif, écosystème SDK embryonnaire. Et pendant ce temps, la crise mémoire DDR5/HBM fait que NVIDIA coupe les RTX 50 series de 30-40%. Ce que ça veut dire pour toi qui veux faire de l'IA locale : achète maintenant, pas dans 6 mois.
Les "Four Little Dragons" du GPU chinois
Pendant que l'Occident regardait la guerre des subventions et les export controls, la Chine a construit une vraie industrie GPU. En mai 2026, quatre acteurs dominent — et ils ne jouent plus la comédie.
Moore Threads — le seul qui fait du gaming ET de l'IA
Moore Threads est le plus complet : GPU gaming grand public (MTT S80, S90) + GPU IA datacenter (S4000) + un laptop ARM (MTT AI Book, 12 cores, sous Windows — avant même le NVIDIA N1X). IPO Shanghai décembre 2025 : 1,1 milliard de dollars levés. Profitabilité atteinte sur les deux segments consumer et enterprise. Clusters IA de 10 000 cartes déjà déployés en Chine.
Leur prochaine architecture Huagang (annoncée décembre 2025) promet 15× en gaming, 50× en ray tracing, DX12 Ultimate complet côté gaming ("Lushan"), et un GPU IA "Huashan" en dual-chiplet avec 9 modules HBM qui se positionnerait entre Hopper et Blackwell. Claims non prouvés, à prendre avec précaution.
Biren Technology — brute force datacenter
Biren joue une autre carte : pur datacenter IA. Le BR100 en packaging 2.5D affiche un FP32 qui dépasse le NVIDIA A100. Pas de gaming, pas de drivers consumer, zéro ambition grand public. IPO Hong Kong janvier 2026. Cible : les clusters d'entraînement chinois qui ne peuvent plus acheter de H100.
Cambricon + MetaX — les outsiders
Cambricon (côté en bourse depuis 2020) fait des puces IA NPU avec architecture originale. MetaX vient de faire son IPO sur le STAR Market. Les deux poussent du 7nm + HBM3e et revendiquent collectivement >1 000 TFLOPS FP8. Mais peu d'info indépendante sur les perfs réelles.
MTT S90 vs RTX 4060 : les benchmarks réels
Pas les benchmarks marketing. Les vrais, mesurés par des testeurs indépendants.
| Benchmark / Jeu | MTT S90 | RTX 4060 | Écart | Verdict |
|---|---|---|---|---|
| 3DMark Steel Nomad | — | — | +9% S90 | MTT gagne |
| 3DMark Fire Strike Ultra | — | — | -12% S90 | NVIDIA gagne |
| Unigine Valley | — | — | +32% S90 | MTT écrase |
| Naraka Bladepoint 4K Ultra | 43 FPS | 42 FPS | +2% | Parité |
| Ray Tracing | Basique | Mature (DLSS 3+) | — | NVIDIA très loin devant |
| DLSS / Upscaling IA | Absent | DLSS 3 + Frame Gen | — | NVIDIA seul |
| CUDA / PyTorch / Ollama | Non | Oui | — | NVIDIA seul |
| Niveau comparable | Intel Arc B570 | — | Mid-range confirmé | |
Verdict gaming : le MTT S90 atteint la parité RTX 4060 en rasterisation pure. C'est historique pour un GPU chinois. Mais sans DLSS, sans ray tracing mature, et sans l'écosystème NVIDIA (GeForce Experience, ShadowPlay, drivers optimisés day-one), l'expérience utilisateur reste très inférieure. Le hardware est là, le software non.
Le vrai mur : pas de CUDA
C'est LE sujet. Le hardware GPU chinois progresse à vitesse folle. Mais sans CUDA, pas d'IA locale. Pas de PyTorch natif, pas de TensorFlow, pas d'Ollama, pas de LM Studio, pas de vLLM, pas de Stable Diffusion. Tout l'écosystème IA local est construit sur CUDA depuis 15 ans.
Moore Threads propose MUSA SDK. Biren/Lisuan poussent LUDA. Mais les deux sont en early stage : documentation rare, communauté quasi inexistante hors Chine, pas de support anglais, pas de package manager intégré, pas de forum/Discord actif. Porter du code CUDA vers MUSA demande des semaines de travail par projet — pas le "pip install" qu'on attend.
Pour l'IA locale en 2026, la réponse est simple : une RTX 3060 12 Go à 280€ fait infiniment plus qu'un MTT S90. Parce que la question n'est pas le TFLOPS brut — c'est "est-ce que ollama run mistral:7b fonctionne ?". Réponse : oui sur RTX 3060, non sur MTT S90.
Crise mémoire 2026 : DDR5, HBM et pénurie GPU
Pendant que la Chine construit ses GPU, une crise silencieuse frappe le marché mondial de la mémoire. Et elle va impacter ton prochain achat hardware.
HBM dévore tout
Les GPU IA datacenter (Blackwell, Rubin) utilisent de la HBM4 : mémoire empilée ultra-rapide, produite uniquement par Samsung, SK Hynix et Micron. La demande des hyperscalers (Microsoft, Google, Meta, xAI) est tellement forte que NVIDIA a coupé la production RTX 50 series de 30-40% au H1 2026. Pourquoi ? Parce que la VRAM des RTX (GDDR6X) est produite sur les mêmes lignes que la HBM, et la HBM rapporte plus par wafer.
Résultat pour le consommateur : RTX 5080 et 5090 en rupture chronique, prix 20-40% au-dessus du MSRP, et pas d'amélioration en vue avant H2 2026 au mieux.
DDR5 en tension
Même logique côté RAM : les fabricants réallouent leur capacité vers HBM. La DDR5 consumer monte en prix depuis Q4 2025. Un kit 64 Go DDR5-6000 qui coûtait ~180€ il y a 6 mois est maintenant à ~250€. Pour les builders IA locale qui veulent 128 Go DDR5 (nécessaire pour les gros modèles en offload), l'addition pique.
CXMT : le joker chinois... limité
CXMT (ChangXin Memory Technologies) est le plus gros fabricant de mémoire chinois. Il inonde le marché de DDR4 à moitié prix et commence à produire de la DDR5 bas de gamme. Il a annoncé l'allocation de 60 000 wafers/mois (20% de sa capacité) à la production HBM3.
Mais la réalité est moins rose : mass production HBM3 en 2026 est jugée "unlikely" par les analystes. CXMT n'a pas accès aux machines EUV (bloquées par les export controls) et doit faire du multi-patterning sur lithographie DUV — plus lent, plus cher, rendement inférieur. Le quasi-monopole Samsung/SK Hynix/Micron sur le HBM haute gamme va durer.
Ce que ça change pour l'IA locale en France
1. N'attends pas les GPU chinois pour l'IA locale
Pas avant 2028-2030 que MUSA/LUDA atteigne un niveau d'écosystème utilisable. Si tu veux faire de l'IA locale maintenant, c'est NVIDIA ou Apple Silicon (Metal). Point. Lire notre guide Mistral local avec Ollama ou comparatif GPU IA locale 2026.
2. Achète ton GPU maintenant, pas dans 6 mois
RTX 50 series en rupture, DDR5 qui monte, HBM qui cannibalise tout. Si tu planifies un build IA locale, les prix ne vont pas baisser avant H2 2026 au mieux. La RTX 4080 Super à 1100€ ou la RTX 4090 d'occasion à 1400-1600€ sont les meilleurs deals dès maintenant. Notre guide RTX 3090 d'occasion détaille les options budget.
3. Impact géopolitique = plus de diversité à long terme
À moyen terme (2028+), les GPU chinois vont créer une vraie alternative à NVIDIA — pas pour remplacer CUDA, mais pour pousser les prix vers le bas et offrir du choix. La compétition est saine. Quand Moore Threads sortira un GPU IA avec support PyTorch natif (via MUSA ou via un portage communautaire), le marché bougera. En attendant, c'est un match pour le futur, pas pour aujourd'hui.
FAQ — Les vraies questions
Le MTT S90 est-il vraiment aussi bon que la RTX 4060 ?
En rasterisation pure, oui sur certains benchmarks (Steel Nomad +9%, Naraka 4K parité). Mais pas de DLSS, pas de ray tracing mature, écosystème logiciel limité. L'expérience globale reste inférieure.
Peut-on acheter un GPU chinois en France en 2026 ?
Très difficilement. Le MTT S90 est dispo en Chine (JD.com, Taobao). Pas de distribution officielle en Europe. Import possible via Alibaba/AliExpress mais sans garantie, sans drivers internationaux, sans support. Déconseillé hors Chine.
Peut-on faire tourner de l'IA locale sur un GPU chinois ?
Non en mai 2026. Pas de CUDA, pas de PyTorch natif. MUSA SDK embryonnaire. Une RTX 3060 12 Go à 280€ fait infiniment plus pour l'IA locale qu'un MTT S90.
Pourquoi NVIDIA ne vend que 8% en Chine ?
Export controls US (2022-2025) interdisent les GPU IA haut de gamme en Chine. NVIDIA vend des versions bridées (H20) mais les entreprises chinoises préfèrent acheter domestique. Les 4 Little Dragons captent 60%+ du marché GPU chinois.
La crise DDR5 est-elle liée aux GPU chinois ?
Indirectement. Samsung/SK Hynix/Micron réallouent vers HBM (pour Blackwell/Rubin). NVIDIA coupe RTX 50 series de 30-40%. CXMT inonde le DDR4/DDR5 bas de gamme mais n'a pas la techno HBM haute gamme. Le goulot est structurel.
Quand les GPU chinois seront-ils une vraie alternative pour l'IA ?
Estimation : 2028-2030. Le hardware progresse vite (Huagang, HBM3e, 7nm). Mais le mur est logiciel : il faudra MUSA/LUDA mature + PyTorch/TensorFlow natif + documentation + adoption communautaire. Effort 3-5 ans minimum.
🎯 Verdict tranché
Pour le gaming chinois domestique : Moore Threads est une vraie réussite. Le MTT S90 à parité RTX 4060, c'est historique. Chapeau.
Pour l'IA locale dans le monde : non, pas encore. CUDA est un moat de 15 ans. MUSA n'a pas 15 mois. Le seul achat rationnel pour l'IA locale en 2026 reste NVIDIA (ou Apple Silicon pour la mémoire unifiée).
Pour le marché mondial : les export controls US accélèrent paradoxalement l'industrie GPU chinoise. En voulant freiner la Chine, on a créé 4 concurrents là où il n'y en avait aucun. L'impact sur les prix GPU/DDR sera positif à terme, mais négatif à court terme (pénurie HBM → rupture RTX 50).
Conseil achat mai 2026 : achète ta RTX 4080 Super / 4090 occasion / Mac Studio M4 maintenant. Les prix ne baissent pas en 2026. Attendre les GPU chinois pour l'IA = attendre 2028-2030 minimum.
Pour aller plus loin :
- Meilleur GPU IA locale 2026 — comparatif RTX 3060 à RTX 5090 + Mac M4
- Mistral local 2026 : guide self-host Ollama
- 128 Go DDR5 sur AM5 : le piège à éviter
- Meilleur mini-PC IA — alternatives compactes
- RTX 3090 d'occasion : le bon deal IA 2026
Article publié le 27 mai 2026 par OutilsIA. Sources : HardwareCooking FR, Tom's Hardware, Wccftech, Notebookcheck, CNBC, Digitimes, Jon Peddie Research. Les benchmarks MTT S90 proviennent de tests indépendants rapportés par HardwareCooking et Wccftech.