Leanstral : Mistral AI s'attaque au goulot d'étranglement de la vérification formelle

Ruben Isaac

Lead AI Tech Watcher

Le Pitch

Leanstral est le premier agent open-source dédié à l'ingénierie de preuves formelles en Lean 4, publié par Mistral AI le 16 mars 2026 (Mistral AI Blog). L'objectif est de liquider le "vibe coding" en prouvant mathématiquement que le code respecte ses spécifications techniques plutôt que de se fier à une simple intuition de génération (Dossier UsedBy).

Sous le capot

Le modèle repose sur une architecture Sparse MoE de 119 milliards de paramètres, dont seulement 6,5 milliards sont actifs par token (Hugging Face). Leanstral affiche un score de 26,3 sur le benchmark FLTEval (pass@2), dépassant les 23,7 de Claude 4.6 Sonnet pour un coût d'inférence divisé par quinze (Blockchain.News).

L'intégration native du Model Context Protocol (MCP) via lean-lsp-mcp permet de connecter l'agent directement à l'écosystème Lean (Mistral AI). Le workflow privilégie un pattern Red-Green TDD où l'agent ne valide l'implémentation qu'une fois la preuve formelle compilée.

Le fossé reste toutefois marqué avec Claude 4.6 Opus sur les raisonnements multi-fichiers complexes, où le modèle d'Anthropic conserve l'avantage malgré un coût de 1 650 $ par pass (HN Comment). L'efficacité de Leanstral sur des langages non formalisés comme Python ou JavaScript reste inconnue et non vérifiée à ce jour (Dossier UsedBy).

On ne sait pas encore comment le modèle se comporte face à des codebases legacy massives en dehors du projet de démonstration sur le dernier théorème de Fermat (Dossier UsedBy). De plus, la tarification officielle pour l'accès API en mode "high-reasoning" n'est pas encore publique (Dossier UsedBy).

L'avis de Ruben

Leanstral n'est pas un outil pour les développeurs qui cherchent un copilote de plus pour générer des fonctions CRUD. C'est un instrument de précision pour les équipes qui pratiquent l'Agentic Engineering et exigent une fiabilité mathématique en CI/CD (Simon Willison's Weblog). Si vous n'utilisez pas Lean 4, passez votre chemin. Si vous développez des systèmes critiques, c'est l'alternative open-source la plus crédible à Claude 4.6 Opus pour automatiser la vérification de vos spécifications.

Codez propre,
Ruben.

Ruben Isaac

Ruben Isaac - Lead AI Tech Watcher at UsedBy.ai

Leanstral : Mistral AI s'attaque au goulot d'étranglement de la vérification formelle

Le Pitch

Sous le capot

L'avis de Ruben

Articles connexes

Magnifica Humanitas : Le Vatican s'invite dans la gouvernance des LLM

La stack de recherche post-Google : Kagi, Uruky et les primitives de Cloudflare

Slumber 5.3 : l'alternative TUI en Rust pour le debugging API

Restez à la pointe des tendances d'adoption de l'IA