J'ai remplacé ChatGPT par Hermes pendant 30 jours : voici ce qui s'est passé
200 €/mois économisés. Confidentialité totale. Mais à quel prix ?
« Le 1er mars, j'ai désinstallé ChatGPT de mon téléphone, annulé mon abonnement Pro à 200 €/mois, et installé Hermes 3 sur mon PC avec Ollama. Mon objectif : prouver qu'on peut travailler uniquement avec une IA gratuite et locale. Voici mon journal de bord. »
Tout le monde parle d'IA locale, mais qui l'utilise vraiment au quotidien ? J'ai décidé de faire le cobaye. Pendant 30 jours complets, Hermes 3 (un modèle open source de Nous Research, 8B paramètres) a été ma seule IA. Pour tout : emails, code, rédaction, brainstorming, analyse de données.
Le résultat m'a surpris. Et pas toujours dans le sens attendu.
💻 Ma configuration de départ
Matériel
- • GPU : NVIDIA RTX 4070 Ti Super (16 Go VRAM)
- • RAM : 32 Go DDR5
- • CPU : Intel i7-13700K
- • OS : Ubuntu 24.04 (WSL2 aussi testé)
Logiciel
- • Ollama (dernière version)
- • Modèle : Hermes 3 8B Q6_K
- • Interface : Open WebUI
- • Backup testé : Mistral 7B, Llama 3.1 8B
📅 Jours 1-3 : Installation et premières impressions
Installation d'Ollama : 3 minutes. Téléchargement de Hermes 3 : 8 minutes. Premier prompt : instantané.
Première surprise : la vitesse de réponse. Sur mon RTX 4070 Ti Super, Hermes génère à ~45 tokens/seconde. C'est plus rapide que ChatGPT aux heures de pointe. Et il n'y a pas de latence réseau — la réponse commence immédiatement.
Test grandeur nature : j'ai utilisé Hermes pour rédiger 5 emails professionnels, résumer un rapport de 20 pages, et générer du code Python.
Qualité des emails : 9/10. Honnêtement, je n'aurais pas vu la différence avec ChatGPT. Le ton est professionnel, le français est correct, les formulations sont variées.
Résumé du rapport : 7/10. Correct mais moins structuré que ce que Claude produirait. Il manque parfois les nuances, et le contexte window de 8K tokens est limitant — j'ai dû découper le rapport en morceaux.
Première frustration : pas de recherche web. J'ai voulu vérifier une info sur un événement récent, et Hermes ne sait rien après sa date de cutoff.
Solution trouvée : j'utilise Perplexity (gratuit) pour la recherche, et Hermes pour tout le reste. Hybride dès le jour 3.
📅 Jours 4-10 : Le quotidien au travail
Après les premiers jours de découverte, j'entre dans la routine. Hermes devient mon outil principal pour 6 tâches quotidiennes :
Parfait. Rédaction, reformulation, réponses — aucune différence notable avec ChatGPT.
Bon pour les scripts simples. Moins bon que Claude Code pour l'architecture complexe, mais suffisant pour 80% de mes besoins.
Articles de blog, posts LinkedIn, notes internes — très bien. Le style est un peu plus générique que Claude mais tout à fait exploitable.
Idées correctes mais moins "surprenantes" que ChatGPT-4 ou Claude. Le modèle 8B a des limites en créativité pure.
Limité par la fenêtre de contexte (8K). Impossible de charger un gros fichier CSV. Pour ça, Claude avec son contexte de 200K est imbattable.
Impossible. Hermes ne sait rien après sa date de cutoff. C'est le principal manque. Solution : Perplexity en complément.
💡 Découverte clé du jour 7 : Hermes est illimité. Pas de "vous avez atteint votre limite", pas de "revenez dans 3 heures". En une journée intense, j'ai envoyé 147 prompts. Avec ChatGPT Pro, j'aurais été limité ou ralenti. Avec Hermes : zéro problème.
📅 Jours 11-20 : Les forces cachées de l'IA locale
Passé le cap des 10 jours, je commence à découvrir des avantages auxquels je ne m'attendais pas :
🔒 Confidentialité absolue
J'ai pu analyser des contrats clients, des données financières sensibles, des documents RH — sans aucune anxiété. Rien ne quitte ma machine. Avec ChatGPT, j'anonymisais toujours les données avant de les envoyer. Avec Hermes : copier-coller direct. Gain de temps énorme.
⚡ Vitesse hors ligne
Dans le train, dans l'avion, en zone blanche — Hermes fonctionne. J'ai écrit un article entier pendant un vol Paris-Lisbonne, sans internet. Essayez ça avec ChatGPT.
💰 0 € par mois
Mon abonnement ChatGPT Pro était à 200 €/mois (avec GPT-4, DALL-E, plugins). En 30 jours sans, j'ai économisé 200 €. Sur un an : 2 400 €. Le GPU s'est remboursé en 4 mois.
🎨 Personnalisation totale
J'ai créé un system prompt personnalisé de 2 000 mots avec mes préférences, mon style d'écriture, mes règles. Hermes le respecte parfaitement à chaque conversation. Pas de "réinitialisation" comme ChatGPT.
📊 Benchmarks réels (pas synthétiques)
Mesurés sur mon matériel, sur mes vrais cas d'usage, pas sur des tests académiques.
| Tâche | Hermes 3 (local) | ChatGPT-4 | Claude 3.5 |
|---|---|---|---|
| Email professionnel | 0.8s | 2.1s | 1.8s |
| Script Python (50 lignes) | 3.2s | 4.5s | 2.9s |
| Résumé (2 pages) | 1.5s | 3.0s | 2.2s |
| Qualité rédaction (note /10) | 7.5 | 9.0 | 9.5 |
| Qualité code (note /10) | 7.0 | 8.5 | 9.0 |
| Coût mensuel | 0 € | 200 € | 18 € |
📅 Jours 21-30 : Le verdict final
Les 10 derniers jours m'ont confirmé une chose : la stratégie optimale n'est pas "tout local" ou "tout cloud" — c'est hybride.
✓ Ce que Hermes fait aussi bien (ou mieux)
- • Rédaction d'emails et messages
- • Reformulation et correction
- • Code simple et scripts
- • Résumés de documents courts
- • Traduction (surprenamment bon)
- • Brainstorming rapide
- • Analyse de données sensibles (confidentialité)
- • Usage hors ligne (avion, train)
✗ Ce qui me manque
- • Recherche web en temps réel
- • Contexte de 200K tokens (Claude)
- • Raisonnement complexe multi-étapes
- • Génération d'images (DALL-E)
- • Analyse de très longs documents
- • Code complexe (architecture logicielle)
- • Connaissance des événements récents
- • Multimodalité (analyse d'images)
⚖️ Comparateur interactif : testez vous-même
Sélectionnez un type de prompt pour voir comment Hermes et ChatGPT répondent différemment :
💡 Ma stratégie hybride finale
Après 30 jours, voici la configuration que j'ai adoptée. Elle combine le meilleur des deux mondes :
IA locale pour le quotidien
Emails, rédaction, code simple, résumés, brainstorming, données sensibles. Gratuit, privé, illimité, hors ligne.
IA cloud pour le complexe
Analyse de longs documents (200K contexte), raisonnement complexe, code d'architecture, recherche web (via Perplexity). 18 €/mois au lieu de 200 €.
💰 Le bilan financier
💻 Le matériel pour reproduire l'expérience
Voici les GPUs recommandés pour faire tourner Hermes en local. Le minimum est une RTX 3060 12 Go :
| GPU | VRAM | Vitesse Hermes | Prix |
|---|---|---|---|
| RTX 3060 12 Go | 12 Go | ~25 tok/s | ~280 € |
| RTX 4070 Ti Super ⭐ | 16 Go | ~45 tok/s | ~750 € |
| RTX 4090 | 24 Go | ~70 tok/s | ~1800 € |
| RTX 5090 | 32 Go | ~100+ tok/s | ~2200 € |
❓ Questions fréquentes
Hermes peut-il vraiment remplacer ChatGPT ?
Pour 80% des usages quotidiens, oui. Pour les 20% restants (recherche web, très longs documents, raisonnement complexe), une IA cloud comme Claude reste supérieure. La stratégie optimale est hybride : Hermes pour le quotidien, Claude pour le complexe.
Quel matériel faut-il pour faire tourner Hermes ?
Minimum : une RTX 3060 12 Go (~280 €) et 16 Go de RAM. Idéal : une RTX 4070 Ti Super 16 Go (~750 €) pour une expérience fluide. Voir notre guide matériel.
Est-ce que Hermes parle bien français ?
Oui, surprenamment bien. Le français est l'une de ses forces. Les emails, la rédaction et la traduction sont de très bonne qualité. Légèrement en dessous de Claude pour les nuances littéraires, mais parfait pour un usage professionnel.
C'est légal de faire tourner une IA locale en France ?
Totalement légal. L'EU AI Act ne restreint pas l'utilisation personnelle ou professionnelle d'IA locale. Vos données ne quittent jamais votre machine, donc aucune réglementation RGPD ne s'applique à un tiers.
👉 Conclusion : pourquoi je ne reviendrai jamais à 100% ChatGPT
« L'IA locale n'est pas une alternative inférieure. C'est un choix stratégique : plus de confidentialité, plus de contrôle, zéro coût récurrent. Le futur de l'IA n'est pas tout cloud ou tout local — c'est intelligent et hybride. »
Si vous hésitez encore, commencez petit. Installez Ollama, téléchargez Hermes, et testez pendant une semaine. Vous serez surpris de ce qu'un modèle 8B peut faire en 2026.
📚 Articles liés
Faites tourner une IA sur votre PC en 5 minutes
Et comment vous adapter dès maintenant
Ce que dit la loi — et l'avantage du local
5 méthodes dont 1 100% locale