Відкрийте SCENE
Лише кілька тижнів після останнього масштабного релізу, OpenAI активно переводить свій флагманський ChatGPT із споживчої новинки в незамінну корпоративну потужність.
У четвер компанія випустила GPT-5.2 — нову велику мовну модель, яка, за їхніми словами, швидша, надійніша і розроблена для обробки складних професійних робочих процесів.
Оновлення свідчить про те, що OpenAI рухається далі за допомогою домашніх завдань і загальних запитів, прагнучи впровадити свою технологію як необхідний, щоденний інструмент у бізнес-сфері, про що свідчать її вигідні угоди з урядом США і Disney.
«Ми розробили GPT‑5.2, щоб розблокувати ще більшу економічну цінність для людей», — заявила OpenAI у заяві. «Він краще створює таблиці, робить презентації, пише код, сприймає зображення, розуміє довгі контексти, використовує інструменти та обробляє складні, багатоступінчасті проекти.»
Під час презентації продуктивності GPT-5.2 компанія представила власний оцінювальний benchmark, GDPval, що імітує завдання у 44 професіях.
GPT-5.2 у 71% випадків співпадає або перевищує продуктивність людського працівника у порівнянні, стверджує компанія.
«На GDPval модель мислення перевершує або дорівнює людським експертам у 70.9% поширених професійних завдань, таких як створення таблиць, презентацій і документів», — написала у X керівниця з застосувань OpenAI Фіджі Сімо. «Він також краще справляється з загальним інтелектом, написанням коду, викликами інструментів, зором і розумінням довгого контексту, щоб розблокувати ще більшу економічну цінність для людей.»
Невідомо, чи проходив benchmark зовнішній огляд, тому галузеві експерти чекають на незалежну перевірку заяв.
GPT-5.2 став доступним у рамках платних підписних рівнів у четвер, з відкриттям API того ж дня. Розробники тепер можуть обирати з трьох різних версій, кожна оптимізована для різних професійних потреб.
Ціноутворення API встановлено на рівні $1.75 за мільйон вхідних токенів і $14 за мільйон вихідних токенів.
Крім benchmark GDPval, GPT-5.2 показала покращену продуктивність у відомих технічних тестах, отримавши вищі бали на GPQA Diamond і FrontierMath. Також повідомляється, що він демонструє більш надійні результати у вимогливих завданнях, таких як кодування, аналіз даних і експериментальний дизайн.
У заяві компанія навела кілька схвальних відгуків від ранніх тестувальників.
Вихід більш компетентного робочого AI вже відбувається в умовах напруженого трудового середовища.
Корпоративні керівники здебільшого налаштовані оптимістично: недавнє опитування Just Capital показало, що 93% бізнес-лідерів вважають AI позитивною силою. Однак у тому ж дослідженні майже половина американців очікує, що технологія знищить робочі місця, тоді як керівники, за повідомленнями, менш стурбовані цим.