Leanstral : Mistral AI s'attaque au goulot d'étranglement de la vérification formelle
Leanstral est le premier agent open-source dédié à l'ingénierie de preuves formelles en Lean 4, publié par Mistral AI le 16 mars 2026 (Mistral AI Blog). L'objectif est de liquider le "vibe coding" en

Le Pitch
Leanstral est le premier agent open-source dédié à l'ingénierie de preuves formelles en Lean 4, publié par Mistral AI le 16 mars 2026 (Mistral AI Blog). L'objectif est de liquider le "vibe coding" en prouvant mathématiquement que le code respecte ses spécifications techniques plutôt que de se fier à une simple intuition de génération (Dossier UsedBy).
Sous le capot
Le modèle repose sur une architecture Sparse MoE de 119 milliards de paramètres, dont seulement 6,5 milliards sont actifs par token (Hugging Face). Leanstral affiche un score de 26,3 sur le benchmark FLTEval (pass@2), dépassant les 23,7 de Claude 4.6 Sonnet pour un coût d'inférence divisé par quinze (Blockchain.News).
L'intégration native du Model Context Protocol (MCP) via lean-lsp-mcp permet de connecter l'agent directement à l'écosystème Lean (Mistral AI). Le workflow privilégie un pattern Red-Green TDD où l'agent ne valide l'implémentation qu'une fois la preuve formelle compilée.
Le fossé reste toutefois marqué avec Claude 4.6 Opus sur les raisonnements multi-fichiers complexes, où le modèle d'Anthropic conserve l'avantage malgré un coût de 1 650 $ par pass (HN Comment). L'efficacité de Leanstral sur des langages non formalisés comme Python ou JavaScript reste inconnue et non vérifiée à ce jour (Dossier UsedBy).
On ne sait pas encore comment le modèle se comporte face à des codebases legacy massives en dehors du projet de démonstration sur le dernier théorème de Fermat (Dossier UsedBy). De plus, la tarification officielle pour l'accès API en mode "high-reasoning" n'est pas encore publique (Dossier UsedBy).
L'avis de Ruben
Leanstral n'est pas un outil pour les développeurs qui cherchent un copilote de plus pour générer des fonctions CRUD. C'est un instrument de précision pour les équipes qui pratiquent l'Agentic Engineering et exigent une fiabilité mathématique en CI/CD (Simon Willison's Weblog). Si vous n'utilisez pas Lean 4, passez votre chemin. Si vous développez des systèmes critiques, c'est l'alternative open-source la plus crédible à Claude 4.6 Opus pour automatiser la vérification de vos spécifications.
Codez propre,
Ruben.

Ruben Isaac - Lead AI Tech Watcher at UsedBy.ai
Articles connexes

Software Abstinence : le moratoire de Xe Iaso face à l'exploit Copy Fail
Xe Iaso propose un arrêt total des installations de nouveaux logiciels et des mises à jour non critiques pendant une semaine. Ce moratoire technique vise à contrer l'exploitation massive de la vulnéra

Cloudflare : restructuration massive au profit d'une architecture agentique interne
Cloudflare licencie 1 100 employés, soit 20 % de ses effectifs, pour automatiser ses processus via des agents IA. L'entreprise profite d'une croissance de 34 % en glissement annuel pour forcer une tra

Instructure Canvas : échec critique de la sécurité en pleine période d'examens
Instructure Canvas, le LMS utilisé par plus de 30 millions d'étudiants, subit actuellement une compromission totale de son infrastructure par le groupe ShinyHunters. Alors que les universités entament
Restez à la pointe des tendances d'adoption de l'IA
Recevez nos derniers rapports et analyses directement dans votre boîte mail. Pas de spam, que des données.