Mistral AI выпустила Leanstral: первый открытый агент кода Lean 4, способный автоматически генерировать формальные доказательства

Gate News сообщает, 17 марта, Mistral AI сегодня выпустила Leanstral — первый открытый агент с исходным кодом, специально разработанный для инструмента формальной верификации Lean 4. Основная инновация модели заключается в том, что она может одновременно генерировать код и выводить формальные доказательства, которые автоматически проверяются Lean 4, тем самым обходя узкое место традиционной ручной проверки при генерации кода AI.

Leanstral использует разреженную архитектуру MoE, обладает 120 миллиардов параметров и 6 миллиардами активных параметров, распространяется под лицензией Apache 2.0 и прошла специальную тренировку и оптимизацию для lean-lsp-mcp. Пользователи могут запускать её в Mistral Vibe с помощью команды /leanstall без настройки или вызывать через бесплатный API-эндпоинт labs-leanstral-2603, а также поддерживается загрузка весов для самостоятельного развертывания.

Mistral одновременно выпустила новый бенчмарк оценки FLTEval, в качестве тестовой сцены использовался проект по формализации Великой теоремы Ферма в сообществе Lean 4. Данные о производительности показывают: Leanstral pass@2 за 36 долларов достигает оценки 26.3, что превышает результат Claude Sonnet 4.6 за 549 долларов с 23.7 балла; pass@16 за 290 долларов показывает 31.9 балла, опережая Sonnet на 8 баллов, тогда как Claude Opus 4.6 требует 1650 долларов для достижения 39.6 баллов. Среди открытых моделей Qwen3.5-397B-A17B нужно выполнить 4 раза, чтобы достичь 25.4 балла, что всё ещё ниже, чем результат Leanstral pass@2.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Виталик: Решения по постквантовой криптографии уже зрелые; Ethereum нацелен на защиту и от квантовых, и от ИИ-угроз

Сообщение Gate News, 22 апреля — Виталик Бутерин заявил в диалоге с Сяо Фэном, что зрелые решения постквантовой криптографии уже существуют, и выразил предпочтение алгоритму GeoHash. Он отметил, что видение Ethereum выходит за рамки простого превращения в постквантовую сеть — сеть также

GateNews59м назад

PicWe запускает кошелёк с AI Agent и управлением ключами на устройстве

PicWe объявляет о публичной бета-версии PicWe Wallet — кошелька с поддержкой AI-агентов, работающего на устройстве и не требующего recovery phrase (фраз восстановления). Он поддерживает мультичейн-активы, свопы, автоматизацию, доступную через AI, и нацелен на объединение инфраструктуры RWA. PicWe запустила публичную бета-версию PicWe Wallet — кошелька, включающего AI Agent и хранящего ключи на устройстве, который исключает recovery phrase и оставляет критически важные операции локальными. Бета поддерживает управление активами в нескольких сетях, свопы и комиссии на основе стейблкоинов, одновременно позволяя программируемые взаимодействия с AI. Более широкие инициативы PicWe позиционируют платформу как единую инфраструктуру для реальных активов, обеспечивая выпуск, обращение, расчёты, платежи через границы, токенизацию и координацию цепочки поставок для корпоративных сценариев использования.

GateNews1ч назад

Виталик: Упрощение системы имеет решающее значение для внедрения Ethereum среди пользователей и разработчиков

Во время мероприятия Foresight News Виталик Бутерин изложил два уровня упрощения — правки на уровне интерфейса и более широкие изменения на уровне системы — и утверждал, что рост Ethereum зависит от снижения сложности системы, чтобы повысить участие пользователей и разработчиков. Бутерин проводит различие между упрощением на уровне интерфейса и упрощением на уровне системы; для Ethereum снижение сложности системы имеет решающее значение, чтобы увеличить участие пользователей и разработчиков и общее внедрение.

GateNews1ч назад

Ripple устанавливает цель на 2028 год для плана Quantum Shift в XRPL

Ripple описывает четырехэтапный план, чтобы подготовить XRPL к квантовым угрозам, с целью полной миграции и обновления сети к 2028 году. Ранние этапы фокусируются на тестировании квантовоустойчивых алгоритмов и гибридной криптографии вместе с партнерами вроде Project Eleven. Ключевая ротация XRPL и конструкция, основанная на seed

CryptoFrontNews1ч назад

Chainlink получает сертификат SOC 2 Type 2 от Deloitte, укрепляя стандарты безопасности

Deloitte завершила аудит Chainlink CCIP SOC 2 Type 2; Chainlink становится единственным оракулом данных и межсетевой совместимости, соответствующим этому стандарту безопасности, и имеет сертификаты SOC 2 Type 1, а также ISO/IEC 27001:2022. В этой статье говорится, что Deloitte & Touche LLP завершила аудит SOC 2 Type 2 протокола Cross-Chain Interoperability Protocol (CCIP) Chainlink и его каналов данных, сделав Chainlink единственной платформой оракула данных и межсетевой совместимости, соответствующей этому стандарту. Также отмечается, что Chainlink имеет сертификаты SOC 2 Type 1 и ISO/IEC 27001:2022, подчеркивая безопасность и соответствие требованиям корпоративного уровня.

GateNews2ч назад

Sunny Side Labs запускает Privacy Boost — корпоративное решение для приватности для основной сети Optimism

Sunny Side Labs запускает Privacy Boost в основной сети Optimism — инструмент приватности на базе SDK, использующий ZK и TEE, с избирательным раскрытием для регуляторов, ориентированный на предприятия; не требуется экспертиза в криптографии. Аннотация: Sunny Side Labs представила Privacy Boost — приватный SDK для предприятий для основной сети Optimism. Он сочетает доказательства с нулевым разглашением и доверенные среды выполнения с избирательным раскрытием, чтобы защищать конфиденциальность транзакций и при этом позволять регуляторам получать только необходимые данные. Решение нацелено на предприятия и организации; plug‑and‑play SDK сводит к минимуму потребность в знаниях по криптографии. Инициатива продолжает текущее сотрудничество с Optimism с конца 2025 года, сигнализируя о более широкой интеграции приватности в основной сети.

GateNews4ч назад
комментарий
0/400
Нет комментариев