Rilis ini lebih fokus pada keandalan dan eksekusi daripada performa mentah.
Ini memperkenalkan agen yang mampu berjalan berjam-jam tanpa menyimpang, bersama dengan pengurangan halusinasi dan kalibrasi yang lebih baik. Keamanan juga diperkuat, dengan ketahanan yang lebih baik terhadap injeksi prompt dan upaya jailbreak.
Model mempertahankan jendela konteks 1 juta token, tetapi sekarang menunjukkan pengambilan dan penalaran yang lebih efektif di seluruh input besar.
Penambahan utama adalah “Routines.”
Ini adalah alur kerja permanen yang dipicu oleh API, jadwal, atau acara, memungkinkan tugas berjalan secara otomatis di latar belakang.
BERIKUT PERUBAHANNYA:
AI bergerak dari asisten ke infrastruktur.
64,3% di SWE-bench, naik dari 53,4%
87,6% pada pengkodean agenik yang diverifikasi
77,3% pada penggunaan alat yang diperbesar
78,0% pada tugas komputer dunia nyata
Ini juga meningkatkan area di mana model biasanya menurun:
79,3% pada pencarian agenik
64,4% pada analisis keuangan
91,5% pada tanya jawab multibahasa
Dan yang penting, penalaran konteks panjang tetap kokoh:
lebih dari 90% penalaran visual dengan alat
94,2% pada tolok ukur tingkat pascasarjana
BERIKUT PELAJARAN UTAMA:
Ini bukan tentang skor puncak.
Ini tentang konsistensi di seluruh domain.
Opus 4.7 tidak mendominasi setiap kategori.
Tapi ia tampil secara andal di semua bidang tersebut.
Itulah yang dibutuhkan sistem produksi.
Perbatasan tidak lagi hanya kecerdasan.
Ini adalah stabilitas di bawah beban kerja nyata.

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

Tambahkan komentar

Tidak ada komentar

Topik Trending
Lihat Lebih Banyak
#
GatePreIPOsLaunchesWithSpaceX
156.33K Popularitas
#
Gate13thAnniversaryLive
424.23K Popularitas
#
IsraelStrikesIranBTCPlunges
29.97K Popularitas
#
US-IranTalksVSTroopBuildup
774.22K Popularitas
#
CryptoMarketRecovery
98.07K Popularitas

Sematkan

peta situs

🚨 ANTHROPIC MENETAPKAN BAKAL BARU DENGAN CLAUDE OPUS 4.7

Topik Trending

GatePreIPOsLaunchesWithSpaceX

Gate13thAnniversaryLive

IsraelStrikesIranBTCPlunges

US-IranTalksVSTroopBuildup

CryptoMarketRecovery

Sematkan