Leanstral : Mistral AI s'attaque au goulot d'étranglement de la vérification formelle
Leanstral est le premier agent open-source dédié à l'ingénierie de preuves formelles en Lean 4, publié par Mistral AI le 16 mars 2026 (Mistral AI Blog). L'objectif est de liquider le "vibe coding" en

Le Pitch
Leanstral est le premier agent open-source dédié à l'ingénierie de preuves formelles en Lean 4, publié par Mistral AI le 16 mars 2026 (Mistral AI Blog). L'objectif est de liquider le "vibe coding" en prouvant mathématiquement que le code respecte ses spécifications techniques plutôt que de se fier à une simple intuition de génération (Dossier UsedBy).
Sous le capot
Le modèle repose sur une architecture Sparse MoE de 119 milliards de paramètres, dont seulement 6,5 milliards sont actifs par token (Hugging Face). Leanstral affiche un score de 26,3 sur le benchmark FLTEval (pass@2), dépassant les 23,7 de Claude 4.6 Sonnet pour un coût d'inférence divisé par quinze (Blockchain.News).
L'intégration native du Model Context Protocol (MCP) via lean-lsp-mcp permet de connecter l'agent directement à l'écosystème Lean (Mistral AI). Le workflow privilégie un pattern Red-Green TDD où l'agent ne valide l'implémentation qu'une fois la preuve formelle compilée.
Le fossé reste toutefois marqué avec Claude 4.6 Opus sur les raisonnements multi-fichiers complexes, où le modèle d'Anthropic conserve l'avantage malgré un coût de 1 650 $ par pass (HN Comment). L'efficacité de Leanstral sur des langages non formalisés comme Python ou JavaScript reste inconnue et non vérifiée à ce jour (Dossier UsedBy).
On ne sait pas encore comment le modèle se comporte face à des codebases legacy massives en dehors du projet de démonstration sur le dernier théorème de Fermat (Dossier UsedBy). De plus, la tarification officielle pour l'accès API en mode "high-reasoning" n'est pas encore publique (Dossier UsedBy).
L'avis de Ruben
Leanstral n'est pas un outil pour les développeurs qui cherchent un copilote de plus pour générer des fonctions CRUD. C'est un instrument de précision pour les équipes qui pratiquent l'Agentic Engineering et exigent une fiabilité mathématique en CI/CD (Simon Willison's Weblog). Si vous n'utilisez pas Lean 4, passez votre chemin. Si vous développez des systèmes critiques, c'est l'alternative open-source la plus crédible à Claude 4.6 Opus pour automatiser la vérification de vos spécifications.
Codez propre,
Ruben.

Ruben Isaac - Lead AI Tech Watcher at UsedBy.ai
Articles connexes

Magnifica Humanitas : Le Vatican s'invite dans la gouvernance des LLM
Le document marque une rupture en liant explicitement l'esclavage historique aux "nouvelles formes d'esclavage numérique" liées à l'automatisation cognitive (source: Washington Post). La présence de C

La stack de recherche post-Google : Kagi, Uruky et les primitives de Cloudflare
La recherche généraliste est saturée par les publicités et les résumés IA intrusifs de Gemini 2.5 qui dégradent la qualité des résultats (Dossier UsedBy). Les power users migrent vers des modèles paya

Slumber 5.3 : l'alternative TUI en Rust pour le debugging API
Slumber est un client HTTP basé sur le terminal qui privilégie la configuration au clic-bouton. Développé en Rust, il propose une approche "un-enshittified" face à des usines à gaz comme Postman en st
Restez à la pointe des tendances d'adoption de l'IA
Recevez nos derniers rapports et analyses directement dans votre boîte mail. Pas de spam, que des données.