Anthropic เปิดตัว Claude Opus 4.7 พร้อมความสามารถทางไซเบอร์ที่อ่อนลง

CryptoFrontier

Anthropic เปิดตัวเวอร์ชันที่อัปเกรดของโมเดลเรือธง Claude Opus 4.7 เมื่อวันที่ 16 เมษายน (ตามเวลาท้องถิ่น) เมื่อเทียบกับโมเดล Opus 4.6 รุ่นก่อนหน้า Opus 4.7 แสดงให้เห็น “การปรับปรุงอย่างมีนัยสำคัญ” ในความสามารถด้านวิศวกรรมซอฟต์แวร์ขั้นสูง โดยเฉพาะในงานที่ยากลำบาก ด้วยความเข้มงวดและความสม่ำเสมอที่เพิ่มขึ้นในกระบวนการที่ซับซ้อนและทำงานมายาวนาน และความสามารถด้านการมองเห็นที่ดีขึ้น อย่างไรก็ตาม Anthropic ได้ลดความสามารถด้านการโจมตี-การป้องกันด้านความปลอดภัยทางไซเบอร์ของโมเดลลงอย่างตั้งใจระหว่างการฝึก และได้เพิ่มกลไกด้านความปลอดภัยเพื่อให้ตรวจจับและบล็อกคำขอที่ต้องห้ามหรือมีความเสี่ยงสูงโดยอัตโนมัติ

ประสิทธิภาพและเกณฑ์ทดสอบ

ในการทดสอบด้วยแบบวัดผล Opus 4.7 ทำคะแนนได้โดยรวมสูงกว่า Opus 4.6 รุ่นก่อนหน้าและ GPT-5.4 ของคู่แข่ง อย่างไรก็ตาม Anthropic ย้ำว่าความสามารถโดยรวมของ Opus 4.7 ยังไม่เทียบเท่าโมเดลที่ทรงพลังที่สุดของบริษัท ซึ่งก็คือ Claude Mythos Preview ตามที่ Anthropic กล่าวไว้: “เมื่อเราปรับใช้และดำเนินการกลไกป้องกันเหล่านี้ในโลกความเป็นจริง เราจะสะสมประสบการณ์เพื่อให้สามารถเปิดตัวโมเดลระดับ Mythos ได้อย่างกว้างขวางในที่สุด”

การใช้งานจริงและการกำหนดราคา

ตอนนี้ Opus 4.7 เปิดให้ใช้งานแล้วในผลิตภัณฑ์และอินเทอร์เฟซ API ของ Claude ทุกตัว โดยผสานรวมกับบริการ Amazon Bedrock, Google Cloud Vertex AI และ Microsoft Foundry การกำหนดราคาเท่าเดิมกับ Opus 4.6: $5 ต่อหนึ่งล้านโทเค็นอินพุต และ $25 ต่อหนึ่งล้านโทเค็นเอาต์พุต.

การเปลี่ยนแปลงการใช้โทเค็น

การเปลี่ยนแปลง 2 ประการใน Opus 4.7 เมื่อเทียบกับ Opus 4.6 จะส่งผลต่อการใช้งานโทเค็น ประการแรก Opus 4.7 ใช้ตัวแบ่งโทเค็น (tokenizer) ที่อัปเดต ซึ่งช่วยปรับปรุงวิธีที่โมเดลประมวลผลข้อความ อย่างไรก็ตาม นี่หมายความว่าข้อมูลอินพุตที่เหมือนกันอาจใช้โทเค็นมากกว่า—ประมาณ 1 ถึง 1.35 เท่าของการใช้โทเค็นในรุ่นก่อน

ประการที่สอง Opus 4.7 ทำการให้เหตุผลมากขึ้นในระดับ “ความเข้มข้นในการคิด” ที่สูง โดยเฉพาะในรอบถัดไปของสถานการณ์เชิงตัวแทน (agentic) สิ่งนี้ช่วยเพิ่มความน่าเชื่อถือสำหรับปัญหาที่ซับซ้อน แต่จะสร้างโทเค็นเอาต์พุตเพิ่มเติม

Token consumption increase visualization จำนวนโทเค็นที่ใช้เพิ่มขึ้นของ Opus 4.7 แหล่งที่มา: Anthropic

การวิเคราะห์ตลาดและบริบท

นักวิเคราะห์มองว่า Opus 4.7 เป็นโมเดลแบบ “การเปลี่ยนผ่าน” นักวิเคราะห์การลงทุน Adam Button ระบุว่าการเปิดตัว Opus 4.7 ตอกย้ำเรื่องเล่าของ Anthropic เกี่ยวกับ “โมเดลระดับเทพ” เช่น Mythos และยืนยันความสงสัยของตลาด: โมเดลแบบชำระเงินที่มีให้ใช้งานสาธารณะนั้นแท้จริงแล้วเป็นเวอร์ชัน “lite” ที่ถูกจำกัดด้วยกลไกด้านความปลอดภัย

ภูมิหลังบริษัทและหมุดหมายความสำเร็จด้านการเงิน

Anthropic ก่อตั้งในปี 2021 โดยอดีตพนักงาน OpenAI บริษัทพัฒนาโมเดลภาษาขนาดใหญ่ตระกูล Claude เมื่อวันที่ 6 เมษายน Anthropic ประกาศว่ารายได้ประจำปีที่คาดการณ์ไว้ (ARR) เกิน $300 พันล้าน ซึ่งเพิ่มขึ้นอย่างมีนัยสำคัญจาก $9 พันล้าน ณ ปลายปี 2025 บริษัทกำลังเดินหน้าหาการเสนอขายหุ้นต่อสาธารณะครั้งแรก (IPO) อย่างแข็งขัน

ความกังวลด้านความเสี่ยงด้านความปลอดภัยทางไซเบอร์

ผู้บริหารของ Anthropic ได้เตือนซ้ำแล้วซ้ำเล่าเกี่ยวกับผลกระทบของ AI ที่มีต่อความปลอดภัยทางไซเบอร์ ตามรายงานที่ลงวันที่ 10 เมษายน (ตามเวลาท้องถิ่น) รัฐมนตรีคลังสหรัฐฯ Yellen และประธานธนาคารกลางสหรัฐฯ Powell ได้เข้าร่วมประชุมฉุกเฉินกับผู้นำจากวอลล์สตรีทเมื่อวันที่ 7 เมษายน เพื่อหารือว่าซึ่งโมเดล AI Mythos รุ่นล่าสุดของ Anthropic อาจเพิ่มความเสี่ยงด้านความปลอดภัยทางไซเบอร์ได้อย่างไร Anthropic ระบุว่า Mythos ไม่เหมาะสำหรับการเปิดตัวสู่สาธารณะ เนื่องจากโมเดลอาจถูกนำไปใช้ในทางที่ผิดโดยอาชญากรไซเบอร์และสายลับ บริษัทกำลังให้การเข้าถึง Mythos อย่างเลือกเฉพาะแก่บริษัทยักษ์ใหญ่ด้านความปลอดภัยทางไซเบอร์และซอฟต์แวร์ระดับโลก

news.article.disclaimer

btc.bar.articles

ไมค์ เครเกอร์ จากแอนโทรปิก ลาออกจากคณะกรรมการฟิกมา

มอฟ ไมค์ เครเกอร์ หัวหน้าฝ่ายผลิตภัณฑ์ของแอนโทรปิก ได้ลาออกจากคณะกรรมการของฟิกมา โดยบริษัทระบุว่าการออกจากตำแหน่งครั้งนี้ไม่เกี่ยวข้องกับความเห็นไม่ตรงกันภายในใด ๆ การจากไปของเขามาหลังจากความร่วมมือระหว่างฟิกมาและแอนโทรปิกเพื่อใส่ผู้ช่วยออกแบบที่ขับเคลื่อนด้วย AI

GateNews9 นาที ที่แล้ว

Cerebras Systems ยื่นขอ IPO ในสหรัฐฯ ความพยายามครั้งที่สองในการเข้าตลาด

Cerebras Systems ยื่นขอเสนอขายหุ้นต่อสาธารณชนครั้งแรก (IPO) ต่อหน่วยงานกำกับดูแลของสหรัฐฯ เมื่อวันที่ 17 เมษายน 2023 โดยถือเป็นความพยายามครั้งที่สองในการเข้าตลาดในฐานะผู้ผลิตชิปสำหรับปัญญาประดิษฐ์ (AI).

GateNews40 นาที ที่แล้ว

DeepSeek เตรียมระดมทุน $300M ที่มูลค่า $10B พันล้านดอลลาร์ ขณะมูลค่าประเมินของ OpenAI และ Anthropic จุดประกายการถกเถียงในตลาด

DeepSeek พยายามระดม $300 ล้านดอลลาร์ที่มูลค่าประเมิน $10 พันล้านดอลลาร์ ซึ่งต่ำกว่าบริษัทเอไอชั้นนำของสหรัฐฯ อย่าง OpenAI และ Anthropic อย่างมาก โมเดล R1 ของพวกเขาที่มีต้นทุนการฝึกต่ำได้เขย่าตลาด จนนักลงทุนกังวลเกี่ยวกับความแตกต่างด้านมูลค่าประเมินและโอกาสในการสร้างรายได้

GateNews1 ชั่วโมง ที่แล้ว

Cerebras ยื่นขอ IPO ขณะที่ดีลกับ OpenAI ขยายเกิน 20 พันล้านดอลลาร์

Cerebras บริษัทผู้ผลิตชิปที่ได้รับการหนุนหลังจาก Nvidia วางแผนยื่นขอเสนอขายหุ้นต่อสาธารณชนครั้งแรก (IPO) ในวันที่ 18 เมษายน โดยปรับกลยุทธ์ไปสู่การให้พลังประมวลผลแบบคลาวด์ หลังจากมีความร่วมมือที่ทำกำไรกับ OpenAI IPO ดังกล่าวเกิดขึ้นท่ามกลางการลงทุนอย่างมีนัยสำคัญในสตาร์ทอัพชิปสำหรับ AI และมูลค่าบริษัทที่พุ่งสูงขึ้น

GateNews4 ชั่วโมง ที่แล้ว

World ขยายการบูรณาการการยืนยันตัวตนกับ Zoom, DocuSign, Tinder และอื่นๆ

World ซึ่งเป็นบริษัทที่ร่วมก่อตั้งโดย Sam Altman ประกาศการบูรณาการใหม่กับแพลตฟอร์มต่างๆ เช่น Zoom และ Tinder โดยช่วยยกระดับระบบการยืนยันตัวตน World ID ของตน โปรโตคอลที่อัปเกรดแล้วทำให้แอปต่างๆ สามารถใช้การตรวจสอบตัวตนแบบเป็นขั้น (tiered) ได้ โดยมีผู้ใช้งานทั่วโลก 17.9 ล้านคน

GateNews6 ชั่วโมง ที่แล้ว

NVIDIA เปิดตัวรุ่นแรกของโลกสำหรับ Quantum AI ที่ออกแบบมาเพื่อ “แบบจำลอง Ising”

NVIDIA ได้เปิดตัวโมเดลโอเพนซอร์ส “NVIDIA Ising” ซึ่งออกแบบมาโดยเฉพาะสำหรับปัญญาประดิษฐ์เชิงควอนตัม โดยมุ่งแก้ความท้าทายด้านการสอบเทียบและการแก้ไขข้อผิดพลาดของควอนตัมโปรเซสเซอร์ ด้วยการใช้เทคโนโลยีภาษาด้วยภาพ ทำให้สามารถลดเวลาในการสอบเทียบลงเหลือเพียงไม่กี่ชั่วโมง และเพิ่มความเร็วและความแม่นยำของการถอดรหัสเพื่อการแก้ไขข้อผิดพลาด โมเดลดังกล่าวได้เชื่อมต่อกับสถาบันวิจัยหลายแห่งแล้ว และเปิดให้ดาวน์โหลด เพื่อผลักดันการประยุกต์ใช้ในตลาดการคำนวณเชิงควอนตัม

ChainNewsAbmedia8 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
StargazingWithAMirroredSpherevip
· 14 ชั่วโมง ที่แล้ว
ตั้งแต่ 4.6 ถึง 4.7 กล่าวว่ามีความ "สำคัญ" ไม่ทราบว่าการปรับปรุงในด้านการดีบักสายโซ่ การสร้างโครงสร้างใหม่ และอัตราการครอบคลุมของการทดสอบนั้นเพิ่มขึ้นมากแค่ไหน?
ดูต้นฉบับตอบกลับ0
OrangePeelRadiovip
· 16 ชั่วโมง ที่แล้ว
ขอเกณฑ์มาตรฐาน: เราจะสามารถค้นหาบั๊กซ่อนเร้นใน PR ที่ซับซ้อนได้ครบถ้วนหรือไม่? อย่าเพียงเขียนตัวอย่างเดโมเล็กๆ เท่านั้น
ดูต้นฉบับตอบกลับ0
BlackVelvetBluePeonyvip
· 16 ชั่วโมง ที่แล้ว
Anthropic นี้จังหวะค่อนข้างแรง ตอนนี้ Claude เริ่มเหมือน “วิศวกรระดับสูง” มากกว่าหุ่นยนต์แชท
ดูต้นฉบับตอบกลับ0
ReminderOfWavesCrashingAgainstvip
· 16 ชั่วโมง ที่แล้ว
ความสามารถด้านวิศวกรรมซอฟต์แวร์เป็นสิ่งสำคัญ การทำงานในระดับคลังโค้ดคือสนามรบที่แท้จริง
ดูต้นฉบับตอบกลับ0
StargazingUnderTheGlassDomevip
· 16 ชั่วโมง ที่แล้ว
4.7 ในที่สุดก็มาแล้ว คอยดูผลทดสอบจริง
ดูต้นฉบับตอบกลับ0
GateUser-5d719abavip
· 16 ชั่วโมง ที่แล้ว
หวังว่าจะไม่ใช่แค่การเพิ่มคะแนนในอันดับอีกต่อไป ในโปรเจกต์จริงเมื่อเจอปัญหาขึ้นกับความขัดแย้งของ dependencies หรือปัญหาเกี่ยวกับสภาพแวดล้อมก็ล้มเหลวทันที
ดูต้นฉบับตอบกลับ0
TheWaveOfRasterizationvip
· 17 ชั่วโมง ที่แล้ว
ฉันสนใจความน่าเชื่อถือของการเรียกใช้งานเครื่องมือและการเปลี่ยนแปลงหลายไฟล์: สามารถรักษาความสอดคล้องกันได้หรือไม่ และไม่ทำให้เกิดปัญหาเมื่อแก้ไขจุดเดียวแล้วเกิดผลกระทบหลายจุด
ดูต้นฉบับตอบกลับ0
StrollingOnTheEdgeOfTheDaovip
· 17 ชั่วโมง ที่แล้ว
รอคอยให้ชุมชนเปรียบเทียบผลการทำงานของ GPT/DeepSeek ในตำแหน่ง SWE โดยเฉพาะการนำทางคลังข้อมูลขนาดใหญ่ การระบุปัญหา และความเร็วในการส่งมอบแบบครบวงจร
ดูต้นฉบับตอบกลับ0
BluePeonyObservervip
· 17 ชั่วโมง ที่แล้ว
4.7 ของ “การเสริมความเข้มงวด” ฟังดูเหมือนจะระมัดระวังมากขึ้น อาจจะเขียน API น้อยลงใช่ไหม? เรื่องนี้สำคัญมาก
ดูต้นฉบับตอบกลับ0
ดูเพิ่มเติม