По данным Beating, Google Gemini 3.1 Flash-Lite перешёл из режима предпросмотра в общую доступность (GA) 8 мая, став самым дешёвым и быстрым в серии Gemini 3. Стоимость ввода установлена на уровне $0,25 за миллион токенов, а вывода — $1,50 за миллион токенов: ввод на 75% дешевле, чем у Claude 4.5 Haiku ($1,00), а вывод — на 70% дешевле ($5,00). Модель поддерживает контекстное окно в 1 миллион токенов и достигает пропускной способности 363 токена в секунду — на 45% быстрее, чем её предшественник Gemini 2.5 Flash.
Бенчмарки производительности показывают GPQA Diamond (рассуждения на уровне аспирантуры по науке) на уровне 86,9%, что выше Claude 4.5 Haiku (73,0%) и GPT-5 mini (82,3%). MMMU-Pro (мультимодальное рассуждение) достигает 76,8%. Среди ранних пользователей — платформа для клиентской поддержки Gladly, которая сообщает о снижении затрат на 60% и 99,6% успешности на рабочих нагрузках в продакшене, а также JetBrains, интегрировавшая Flash-Lite в инструменты IDE для помощи пользователям.
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к
Отказу от ответственности.
Связанные статьи
CoreWeave превышает прогнозы выручки за 1-й квартал: $2,08 млрд, акции растут на 3%
По данным Reuters, CoreWeave сообщила о выручке за первый квартал в размере 2,08 миллиарда долларов по состоянию на 7 мая, превысив среднюю оценку аналитиков в 1,97 миллиарда долларов. Сильный спрос на высокопроизводительные вычисления, используемые для обучения и запуска AI-моделей, обеспечил рост облачного провайдера. Ее акции выросли на 3% в расширенных торгах
GateNews2м назад
OpenAI переключает ChatGPT на модель GPT-5.5 по умолчанию — мгновенно, снижает галлюцинации на 52,5%
По данным OpenAI, компания 8 мая перевела модель по умолчанию ChatGPT на GPT-5.5 Instant. Во внутренних тестах модель генерировала на 52,5% меньше галлюцинированных утверждений, чем GPT-5.3 Instant, в запросах повышенной важности, при этом снижая число неточных утверждений на 37,3% в разговорах, которые пользователи помечали для фактической ошибк er
GateNews12м назад
Генеральный директор Nvidia Хуанг: Для инфраструктуры ИИ следующего поколения нужны масштабные оптические соединения, медь недостаточна 8 мая
Согласно BlockBeats, 8 мая глава Nvidia Дженсен Хуанг заявил, что для инфраструктуры ИИ следующего поколения потребуется большое количество оптических соединений, поскольку медь не справляется с быстро растущими вычислительными потребностями. Хуанг высоко оценил новую партнерскую инициативу Nvidia с Corning, назвав её важной возможностью
GateNews16м назад
Cloudflare увольняет более 1 100 сотрудников (20% персонала), чтобы перейти к работе, управляемой ИИ
Как сообщает Reuters, Cloudflare уволила более 1 100 сотрудников, что составляет примерно 20% от штата, 8 мая — чтобы реорганизовать работу вокруг AI-инструментов. Генеральный директор Мэтью Принс заявил, что компания заново проектирует каждую команду и каждую функцию, чтобы адаптироваться к эпохе агентного ИИ, отметив внутреннее использование ИИ
GateNews30м назад
Google запускает Fitbit Air за $99,99: неэкранный трекер станет хабом Gemini Health Coach 26 мая
По данным Beating, Google запустила Fitbit Air — бесэкранный трекер здоровья по цене $99,99, который должен поступить в продажу 26 мая. Устройство весит всего 5,2 грамма и оснащено батареей на 7 дней с функцией быстрой зарядки за 5 минут. Датчики отслеживают 24-часовой мониторинг частоты сердечных сокращений, выявление фибрилляции предсердий, уровень кислорода в крови, h
GateNews32м назад
OpenAI выпускает три голосовые модели в Realtime API; GPT-Realtime-2 предлагает контекстное окно на 128K
Beating: OpenAI выпустила три голосовые модели в своей Realtime API: GPT-Realtime-2 для голосового разговора с рассуждениями, GPT-Realtime-Translate для перевода в реальном времени и GPT-Realtime-Whisper для потоковой транскрипции. GPT-Realtime-2 — первая голосовая модель OpenAI с уровнем GPT-5-ре
GateNews48м назад