Google DeepMind выпустила ИИ со-математика — многoагентного исследовательского помощника по математике, достигнув 47,9% точности в бенчмарке FrontierMath Tier 4, превзойдя предыдущий рекорд GPT-5.5 Pro (39,6%) от 9 мая. Система решила 23 из 48 задач, включая 3, которые до этого не смогли решить ни одна из предыдущих моделей. Построенная на Gemini 3.1 Pro архитектура использует иерархический дизайн: агент-координатор проекта распределяет задачи между субагентами, отвечающими за извлечение литературы, кодирование и рассуждения; перед подачей несколько агентов-ревьюеров валидируют доказательства.
Epoch AI провела слепое тестирование, не позволяя команде DeepMind видеть задачи, при этом на каждый вопрос отводилось по 48 часов вычислений. В реальном применении математик Марк Лакенби использовал систему, чтобы разрешить открытую гипотезу из Kourovka Notebook, демонстрируя ее практическую исследовательскую ценность. Сейчас система доступна ограниченному числу математиков в рамках бета-тестирования.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
Судья США признал незаконными сокращения гранта DOGE после использования ChatGPT и ключевых слов о DEI, заблокировал принудительное исполнение в четверг
По данным ABC News, в четверг федеральный судья США постановил, что сокращения грантов, проведённые поддерживаемым Илоном Маском DOGE, были незаконными. Окружная судья США Колин Макмахон в Нью-Йорке заявила, что сотрудники использовали ChatGPT и поисковые запросы по ключевым словам, включая «DEI», «Equity», «Inclusion» и «LGBTQ», чтобы помочь прекратить финансирование программ в рамках National Endowment for the Humanities. Судья заблокировала администрации Трампа возможность применять оспаривае
GateNews52м назад
Официальный представитель ЕЦБ заявил, что риски ИИ побудят провести обзор финансовой инфраструктуры в субботу
Хосе-Луис Эскрива, член руководящего совета Европейского центрального банка и глава Банка Испании, в субботу заявил, что центральные банки должны пересмотреть устойчивость финансовой инфраструктуры и кибербезопасность на фоне роста роли искусственного интеллекта. «Недавние события в сфере искусственного интеллекта заставляют нас пересмотреть устойчивость нашей финансовой инфраструктуры и нашу кибербезопасность», — сказал Эскрива на мероприятии в Таррагоне. Он также подчеркнул роль центральных ба
GateNews1ч назад
Акции Cloudflare падают на 23,62% 8 мая после публикации отчетности за 1-й квартал и объявления о сокращении штата на 1 100 человек
Акции Cloudflare упали на 23,62% 8 мая до $196,13 за акцию после публикации компанией отчёта о финансовых результатах за первый квартал и объявления о примерно 1 100 сокращениях. Хотя выручка за Q1 в размере $640 миллионов превысила ожидания, показав рост на 34% в годовом выражении, прогноз по выручке на второй квартал $664–$665 миллионов не дотянул до предыдущего ожидания рынка в $666 миллионов. Сокращения, составляющие около 20% штата, являются частью перехода компании к модели работы «AI-agen
GateNews3ч назад
Helsing планирует привлечь финансирование при оценке в 18 миллиардов долларов
Согласно Financial Times, Helsing, немецкий стартап по беспилотникам с ИИ, планирует привлечь новое финансирование при оценке примерно в $18 миллиарда.
GateNews3ч назад
Система вознаграждений OpenAI непреднамеренно оценивает цепочки рассуждений на 6 моделях, включая GPT-5.4
Команда по согласованию (alignment) OpenAI недавно обнаружила критическую ошибку в обучении, затрагивающую 6 крупных языковых моделей, включая GPT-5.4. Ошибка заключалась в том, что механизм вознаграждения случайно присваивал баллы «цепочкам мышления» — внутреннему процессу рассуждений перед формированием ответов. На GPT-5.5 это не повлияло. Инцидент нарушает фундаментальный принцип безопасности ИИ: цепочки мышления нельзя оценивать, поскольку это может побудить модели выдумывать рассуждения для
GateNews5ч назад
Alibaba не вела переговоры с DeepSeek, разъяснили рыночные источники 9 мая
По данным рыночных источников, о которых сообщило Caixin Daily 9 мая, Alibaba не вела переговоры с DeepSeek о финансировании. Это уточнение последовало за более ранними сообщениями СМИ, которые предполагали, что переговоры между двумя компаниями сорвались. В апреле DeepSeek запустила заметный раунд привлечения средств, вызвавший интерес со стороны как Tencent, так и Alibaba.
GateNews5ч назад