Nvidia Greenboost : analyse technique de l'extension de VRAM par module noyau
Nvidia Greenboost est un module noyau Linux doublé d'un shim CUDA permettant d'étendre virtuellement la VRAM d'un GPU en agrégeant la RAM système et le stockage NVMe. Publié le 15 mars 2026 par Ferran

Le Pitch
Nvidia Greenboost est un module noyau Linux doublé d'un shim CUDA permettant d'étendre virtuellement la VRAM d'un GPU en agrégeant la RAM système et le stockage NVMe. Publié le 15 mars 2026 par Ferran Duarri, ce projet vise à faire tourner des LLM massifs sur du hardware grand public sans modifier le code d'inférence (source: GitLab). L'idée sature actuellement Hacker News, promettant une transparence totale pour les runtimes modernes.
Sous le capot
Le projet repose sur une architecture mémoire à trois niveaux : T1 (VRAM), T2 (RAM système) et T3 (Swap NVMe). Techniquement, le module utilise DMA-BUF pour gérer les transferts, ce qui assure la compatibilité avec ExLlamaV3 (format EXL3), Ollama et TensorRT-Edge-LLM (source: GitLab Project Docs). Une version Windows est en cours de développement par la communauté, utilisant des mappings MDL plutôt que DMA-BUF (source: GitHub).
La "transparence" mise en avant par le marketing cache des failles architecturales majeures. Le noyau ne réserve pas la RAM système utilisée par le shim, ce qui induit en erreur le gestionnaire de mémoire de l'OS. En conséquence, l'OOM killer se déclenche de manière imprévisible dès que la pression mémoire augmente (source: HN). De plus, un défaut technique dans la gestion des collisions de hash du tracker d'allocation provoque des fuites de mémoire persistantes jusqu'au reboot (source: GitHub Issues).
Les performances annoncées de 60 tok/s sont trompeuses : elles concernent uniquement des modèles EXL3 en 2bpw qui tiennent intégralement dans la VRAM physique (source: Reddit). Dès que le mécanisme d'extension s'active, le goulot d'étranglement du bus PCIe 4.0 fait chuter la vitesse d'inférence entre 2 et 5 tok/s. On manque encore de données précises sur le débit avec le standard PCIe 5.0 et sur l'impact de l'endurance TBW des SSD lors d'un usage intensif du KV-cache en Tier 3 (source: Dossier UsedBy).
L'avis de Ruben
Oubliez la production, et soyez prudents même en environnement de test. Le nom "Nvidia Greenboost" est une usurpation de marque flagrante qui garantit un takedown imminent ou un rebranding forcé. Au-delà du risque juridique, l'instabilité du module noyau et les fuites de mémoire rendent l'outil inutilisable pour quiconque a besoin d'un système stable. C'est un hack technique intéressant pour la recherche, mais le bottleneck matériel du PCIe reste une réalité physique que le code ne peut pas contourner. Passez votre chemin et restez sur du quantize agressif ou du multi-GPU natif.
Codez propre,
Ruben.

Ruben Isaac - Lead AI Tech Watcher at UsedBy.ai
Articles connexes

Tin Can : Analyse technique du terminal VOIP pour enfants
Tin Can est un terminal VOIP Wi-Fi et Ethernet conçu pour remplacer le smartphone chez les mineurs via un système de liste blanche. L'appareil mise sur un design nostalgique sans écran pour limiter l'

PC Gamer prône la sobriété web avec une page de 37 Mo
PC Gamer appelle ses lecteurs à "tuer l'algorithme" en revenant aux flux RSS pour échapper à l'en-shittification du web moderne. Le sujet s'est transformé en cas d'école sur Hacker News à cause d'un p

Stratégie POSSE : l’état de l’art de la syndication de contenu en 2026
Le POSSE (Publish on your Own Site, Syndicate Elsewhere) vise à reprendre le contrôle total sur la propriété des données. L'idée est de centraliser l'autorité sur son propre domaine tout en exploitant
Restez à la pointe des tendances d'adoption de l'IA
Recevez nos derniers rapports et analyses directement dans votre boîte mail. Pas de spam, que des données.