Temukan SCENE
Hanya beberapa minggu setelah rilis besar terakhirnya, OpenAI secara agresif mengalihkan fokus dari ChatGPT yang awalnya sebagai inovasi konsumen menjadi kekuatan korporat yang tak tergantikan.
Pada hari Kamis, perusahaan merilis GPT-5.2, sebuah model bahasa besar baru yang diklaim lebih cepat, lebih andal, dan dirancang untuk menangani alur kerja profesional yang kompleks.
Pembaharuan ini menandakan bahwa OpenAI bergerak melampaui bantuan tugas rumah dan pertanyaan umum, bertujuan untuk menyematkan teknologinya sebagai alat penting harian di dunia bisnis, seperti yang dibuktikan dengan kesepakatan menguntungkan dengan pemerintah AS dan Disney.
“Kami merancang GPT‑5.2 untuk membuka nilai ekonomi yang lebih besar bagi orang-orang,” kata OpenAI dalam sebuah pernyataan. “Ini lebih baik dalam membuat spreadsheet, menyusun presentasi, menulis kode, memahami gambar, memahami konteks panjang, menggunakan alat, dan menangani proyek kompleks multi-langkah.”
Membanggakan kinerja GPT-5.2, perusahaan memperkenalkan tolok ukur evaluasi milik sendiri, GDPval, yang mensimulasikan tugas di 44 pekerjaan.
GPT-5.2 mencocokkan atau melebihi kinerja pekerja manusia dalam sekitar 71% perbandingan, klaim perusahaan.
“Di GDPval, model berpikir mengalahkan atau seri dengan ahli manusia dalam 70,9% tugas profesional umum seperti spreadsheet, presentasi, dan pembuatan dokumen,” tulis CEO Aplikasi OpenAI, Fidji Simo di X. “Ini juga lebih baik dalam kecerdasan umum, menulis kode, memanggil alat, penglihatan, dan pemahaman konteks panjang sehingga dapat membuka nilai ekonomi yang lebih besar bagi orang.”
Tidak jelas apakah tolok ukur ini telah menjalani tinjauan eksternal, meninggalkan para ahli industri untuk menunggu verifikasi independen terhadap klaim-klaim tersebut.
GPT-5.2 tersedia di berbagai tingkat langganan berbayar pada hari Kamis, dengan akses API dibuka pada hari yang sama. Pengembang kini dapat memilih dari tiga versi berbeda, masing-masing dioptimalkan untuk kebutuhan profesional yang berbeda.
Harga API ditetapkan sebesar $1,75 per jutaan token input dan $14 per jutaan token output.
Selain tolok ukur GDPval, GPT-5.2 menunjukkan peningkatan kinerja pada tes teknis yang sudah mapan, dengan skor lebih tinggi di GPQA Diamond dan FrontierMath. Ia juga dilaporkan menunjukkan hasil yang lebih andal dalam tugas yang menuntut seperti pengkodean, analisis data, dan desain eksperimen.
Dalam pengumuman tersebut, perusahaan menyajikan beberapa pernyataan umpan balik positif dari penguji awal.
Peluncuran AI tempat kerja yang lebih kompeten ini hadir di tengah lingkungan tenaga kerja yang sudah tegang.
Eksekutif perusahaan tampaknya sebagian besar optimis, dengan survei Just Capital terbaru menunjukkan 93% pemimpin bisnis menganggap AI sebagai kekuatan positif. Namun, studi yang sama menemukan hampir setengah dari warga AS mengharapkan teknologi ini akan menghilangkan pekerjaan, kekhawatiran yang dilaporkan kurang dibagikan oleh para eksekutif.