OpenAI выпускает ИИ-модель GPT-5.5 с нативным использованием компьютера

CryptoFrontier

OpenAI официально выпустила GPT-5.5 23 апреля 2026 года — новую модель ИИ, предназначенную для понимания намерений пользователя в реальных приложениях благодаря возможностям нативного использования компьютера. Модель оснащена универсальными нативными возможностями, которые позволяют ей перемещаться по настольным приложениям, нажимать кнопки и вводить текст для многошаговых рабочих процессов, согласно объявлению OpenAI.

GPT-5.5 сочетает нативное использование компьютера с продвинутыми возможностями рассуждений, автономно навигируя по программным инструментам, необходимым для задач высокого уровня в профессиональной сфере. Контекстное окно модели ~1,1 млн токенов позволяет ей обрабатывать массивные финансовые датасеты, которые ранее требовали ручной разбиение на фрагменты. Финансовая команда OpenAI использовала GPT-5.5 для проверки 24,771 налоговых форм K-1 (71,637 страниц) и завершила задачу на две недели быстрее, чем в предыдущем году.

Performance Benchmarks

GPT-5.5 набрала 88,5% на внутренних задачах моделирования для инвестиционного банкинга и 60% на бенчмарке FinancialAgent v1.1, обойдя GPT-5.4 на четыре пункта. Модель достигла 84,9% на GDPval, где проверяются способности агентов выполнять конкретную интеллектуальную работу в 44 профессиях. На OSWorld-Verified, измеряющем автономные реальные операции модели на компьютере, модель достигла 78,7%. GPT-5.5 набрала 98% на Tau2-bench Telecom — тесте для крайне сложных сценариев обслуживания клиентов.

Сотрудник команды Go-to-Market подтвердил, что автоматизация еженедельных бизнес-отчетов сэкономит примерно 5-10 часов ручной работы в неделю.

Code Generation and System Optimization

OpenAI сообщает, что GPT-5.5 использовалась, чтобы помочь написать код для собственной инфраструктуры развертывания. Модель достигла «System-Level Optimization», анализируя паттерны производственного трафика, чтобы написать пользовательские эвристики балансировки нагрузки, увеличив собственную скорость генерации токенов на 20%.

В тесте для разработчиков модель попросили «переработать архитектуру markdown-редактора», и она вернула почти полностью готовый стек из 12 диффов с минимальными исправлениями со стороны человека. OpenAI отмечает, что новая модель находит правильный ответ за меньшее число ходов и использует на 40% меньше токенов для тех же задач Codex по сравнению с GPT-5.4.

Dan Shipper, основатель и CEO Every, описал GPT-5.5 как первую кодинговую модель, у которой есть «серьезная концептуальная ясность». Шиппер протестировал GPT-5.5 после того, как он и его лучший инженер провели несколько дней, отлаживая проблему после релиза в приложении. По словам Шиппера, GPT-5.5 достигла того, чего не смогла GPT-5.4: она проанализировала сломанный код и сгенерировала переписывание, которое инженер в итоге решил применить. Модель может «помнить» и делать перекрестные ссылки на целые библиотеки информации, не теряя своего места, снижая «галлюцинации», которые преследовали более ранние версии.

Autonomous Capabilities and Self-Correction

OpenAI утверждает, что GPT-5.5 оптимизирована для «самокоррекции» и автономности. Она лучше справляется с интерпретацией неоднозначных инструкций и использованием компьютерного интерфейса (clicking, typing, browsing), чтобы достигать целей без вмешательства человека. Модель становится особенно полезной, когда агенту нужно управлять программным обеспечением, вести рабочие процессы, перегруженные терминалом, или рассуждать по целому кодобазу (500K+ tokens) с высокой точностью извлечения.

GPT-5.5 Thinking Feature

В ChatGPT OpenAI представила «GPT-5.5 Thinking», которую компания называет решением, открывающим более быстрые ответы на более сложные проблемы. Эта функция предоставляет умные, более краткие ответы, чтобы помочь пользователям эффективнее выполнять сложные задачи. Она особенно хорошо работает в профессиональной деятельности вроде синтеза и анализа информации, программирования и задач с большим количеством документов, таких как исследования, особенно при использовании плагинов.

Ранние тестеры GPT-5.5 Pro сообщают о массивном улучшении и качества, и сложности работы, которую ChatGPT может брать на себя. Низкая задержка делает ее более практичной для требовательных задач, чем GPT-5.4 Pro. Ответы GPT-5.5 Pro хорошо структурированы, релевантны, полезны и точны, с особенно сильной производительностью в праве, data science, бизнесе и образовании.

Pricing and Accessibility

Хотя базовая версия доступна, самая способная версия (GPT-5.5 Pro) стоит $100 в месяц для индивидуальных подписчиков. Для бизнеса стоимость за токен вывода примерно вдвое выше, чем у GPT-5.4, даже при 40% более высокой эффективности токенов. Общие расходы для крупномасштабных агентных развертываний могут быть существенными. Растет обеспокоенность тем, что самый высокий уровень рассуждений станет «предметом роскоши», доступным только хорошо финансируемым компаниям, потенциально расширяя разрыв в производительности между крупными предприятиями и небольшими стартапами.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
AprDaydreamvip
· 3ч назад
Надеюсь, что официальные органы предоставят возможность проверки действий/воспроизведения, иначе при возникновении проблем будет трудно привлечь к ответственности, особенно в случае автоматического управления активами.
Посмотреть ОригиналОтветить0
PaperHandsProvip
· 3ч назад
Реальное понимание намерений — это настоящая сложность, надеюсь, больше не будет неловких ситуаций, когда вы хотите забронировать билет, а он изменяет ваше резюме.
Посмотреть ОригиналОтветить0
Half-SectionedSucculentvip
· 3ч назад
Есть небольшое ожидание, и немного опасения: возможность щелкнуть мышью равносильно выполнению многих задач, которые требуют «человеческих кликов», поэтому системы управления рисками и антифрод должны быть усовершенствованы.
Посмотреть ОригиналОтветить0
ACalmnessWithAHintOfPomelovip
· 3ч назад
Эта волна также повлияет на Web3, если автоматизированные операции в цепочке, процессы подписи и взаимодействие с кошельками смогут выполняться без швов, форма продукта изменится.
Посмотреть ОригиналОтветить0
StarsInTheGlassDomevip
· 3ч назад
API и цены пока не спешите, сначала посмотрите, сможет ли он выдержать всплывающие окна, многозадачность и сетевые колебания в сложной настольной среде.
Посмотреть ОригиналОтветить0
GateUser-b665e41cvip
· 3ч назад
Чувствуется, что эволюция идет от «умения говорить и писать» к «умению делать и сдавать», а следующий шаг — обеспечить ей лучшее запоминание и управление задачами.
Посмотреть ОригиналОтветить0
LintCollectorvip
· 3ч назад
Если действительно возможно связать приложения: поиск информации в браузере → обработка в Excel → подготовка презентации в PPT → отправка по электронной почте, тогда это будет полный цикл работы в офисе.
Посмотреть ОригиналОтветить0
DegenWithNotebookvip
· 3ч назад
Наконец-то появилась нативная десктопная версия? Теперь действительно придется играть роль «цифрового стажера».
Посмотреть ОригиналОтветить0