Anthropic ปรับใช้มาตรการคุ้มครองการเลือกตั้งสำหรับ Claude ก่อนการเลือกตั้งกลางเทอมปี 2026

CryptoFrontier

Anthropic ประกาศเมื่อวันศุกร์ถึงมาตรการเพื่อความซื่อสัตย์ในการเลือกตั้งชุดหนึ่ง ซึ่งออกแบบมาเพื่อป้องกันไม่ให้แชตบอต Claude ของบริษัทถูกนำไปใช้เป็นอาวุธในการเผยแพร่ข้อมูลบิดเบือนหรือชักจูงผู้มีสิทธิเลือกตั้ง ก่อนการเลือกตั้งกลางเทอมสหรัฐฯ ปี 2026 และการแข่งขันครั้งสำคัญอื่นๆ ทั่วโลกในปีนี้ บริษัทที่ตั้งอยู่ในซานฟรานซิสโกได้สรุปแนวทางแบบหลายด้าน ซึ่งรวมถึงระบบตรวจจับอัตโนมัติ การทดสอบภายใต้แรงกดดันเพื่อต้านทานปฏิบัติการเชิงอิทธิพล และการร่วมมือกับองค์กรทรัพยากรผู้มีสิทธิเลือกตั้งที่ไม่ฝักใฝ่ฝ่ายใด—มาตรการเหล่านี้สะท้อนแรงกดดันที่เพิ่มขึ้นต่อผู้พัฒนา AI ให้คอยกำกับดูแลว่าเครื่องมือของตนถูกใช้อย่างไรในช่วงฤดูกาลการเลือกตั้ง

นโยบายการใช้งานด้านการเลือกตั้ง

นโยบายการใช้งานของ Anthropric ห้ามไม่ให้ Claude ถูกนำไปใช้เพื่อดำเนินแคมเปญการเมืองที่หลอกลวง สร้างเนื้อหาดิจิทัลปลอมที่ตั้งใจเพื่อชักนำให้เกิดอิทธิพลต่อการพูดคุยทางการเมือง กระทำการฉ้อโกงผู้มีสิทธิเลือกตั้ง รบกวนโครงสร้างพื้นฐานการลงคะแนนเสียง หรือเผยแพร่ข้อมูลที่ทำให้เข้าใจผิดเกี่ยวกับกระบวนการลงคะแนนเสียง

ผลการทดสอบเพื่อการปฏิบัติตามข้อกำหนด

เพื่อบังคับใช้นโยบายด้านการเลือกตั้ง Anthropic ได้ทดสอบโมเดลใหม่ล่าสุดโดยใช้พรอมป์ 600 ข้อ—คำขอที่เป็นอันตราย 300 ข้อคู่กับคำขอที่ถูกต้องตามกฎหมาย 300 ข้อ—เพื่อวัดว่า Claude ปฏิบัติตามคำขอที่เหมาะสมได้อย่างน่าเชื่อถือเพียงใด และปฏิเสธคำขอที่มีปัญหาได้หรือไม่ Claude Opus 4.7 และ Claude Sonnet 4.6 ตอบสนองได้อย่างเหมาะสม 100% และ 99.8% ของเวลา ตามลำดับ

บริษัทได้ทดสอบโมเดลของตนกับกลยุทธ์การบิดเบือนที่ซับซ้อนยิ่งขึ้นด้วยเช่นกัน โดยใช้การสนทนาแบบจำลองหลายรอบที่ออกแบบมาเพื่อสะท้อนขั้นตอนวิธีการทีละขั้นที่ผู้ไม่หวังดีอาจใช้ Sonnet 4.6 และ Opus 4.7 ตอบสนองได้อย่างเหมาะสม 90% และ 94% ของเวลา เมื่อทดสอบกับสถานการณ์ปฏิบัติการเชิงอิทธิพล

Anthropric ยังได้ทดสอบเพิ่มเติมว่าโมเดลของตนสามารถดำเนินการปฏิบัติการเชิงอิทธิพลได้อย่างอิสระหรือไม่—การวางแผนและดำเนินแคมเปญแบบหลายขั้นตั้งแต่ต้นจนจบ โดยไม่ต้องมีการกระตุ้นจากมนุษย์ ด้วยมาตรการป้องกันที่มีอยู่ โมเดลล่าสุดของบริษัทจึงปฏิเสธงานแทบทุกงานตามที่บริษัทระบุ

การประเมินความเป็นกลางทางการเมือง

ในประเด็นเรื่องความเป็นกลางทางการเมือง Anthropic จะทำการประเมินก่อนการเปิดตัวโมเดลแต่ละครั้ง เพื่อวัดว่า Claude มีปฏิสัมพันธ์กับพรอมป์ที่แสดงมุมมองจากทั่วทั้งสเปกตรัมการเมืองอย่างสม่ำเสมอและเป็นกลางเพียงใด Opus 4.7 และ Sonnet 4.6 ทำคะแนนได้ 95% และ 96% ตามลำดับ

แบนเนอร์ข้อมูลด้านการเลือกตั้ง

สำหรับผู้ใช้งานที่ต้องการข้อมูลเกี่ยวกับการลงคะแนนเสียง Claude จะแสดงแบนเนอร์การเลือกตั้งที่พาพวกเขาไปยัง TurboVote ซึ่งเป็นแหล่งข้อมูลที่ไม่ฝักใฝ่ฝ่ายใดจาก Democracy Works ที่ให้ข้อมูลที่เชื่อถือได้แบบเรียลไทม์เกี่ยวกับการลงทะเบียนผู้มีสิทธิเลือกตั้ง สถานที่ลงคะแนน วันที่จัดการเลือกตั้ง และรายละเอียดบัตรลงคะแนน จะมีการวางแผนแบนเนอร์ลักษณะคล้ายกันสำหรับการเลือกตั้งของบราซิลในช่วงปลายปีนี้ด้วย

การติดตามอย่างต่อเนื่อง

Anthropric กล่าวว่าจะยังคงติดตามระบบของตนและปรับปรุงแนวป้องกันให้ดียิ่งขึ้นตามที่วัฏจักรการเลือกตั้งดำเนินไป

news.article.disclaimer

btc.bar.articles

Baidu Qianfan เปิดตัวการรองรับ Day 0 สำหรับ DeepSeek-V4 พร้อมบริการ API

อัปเดตข่าวประตู 25 เมษายน — เวอร์ชันพรีวิว DeepSeek-V4 เปิดตัวและเผยแพร่โค้ดโอเพนซอร์สเมื่อวันที่ 25 เมษายน โดยแพลตฟอร์ม Baidu Qianfan ภายใต้ Baidu Intelligent Cloud ให้บริการการปรับใช้งาน Day 0 ผ่าน API บริการดังกล่าว โมเดลมีหน้าต่างคอนเท็กซ์ต์แบบขยายได้ถึงหนึ่งล้านโทเค็น และมีให้ใช้งาน 2 เวอร์ชัน: DeepSeek-V4

GateNews3 ชั่วโมง ที่แล้ว

หลักสูตร AI ของสแตนฟอร์ดผสานผู้นำในอุตสาหกรรมอย่าง หวง เหรินจวิน และ Altman ท้าทายการสร้างคุณค่าให้โลกภายใน 10 สัปดาห์!

หลักสูตรวิทยาการคอมพิวเตอร์ด้าน AI 《Frontier Systems》 ที่มหาวิทยาลัยสแตนฟอร์ด (Stanford University) เปิดสอนเมื่อไม่นานมานี้ ได้รับความสนใจอย่างสูงจากวงการอุตสาหกรรมและภาคธุรกิจ ดึงดูดนักศึกษามากกว่า 500 คนให้ลงทะเบียนเรียน หลักสูตรนี้ได้รับการดูแลและประสานงานโดยคู่หูของกองทุนชั้นนำ a16z อย่าง Anjney Midha โดยมีผู้สอนที่รวมรายชื่อระดับท็อปไว้มากมาย ได้แก่ CEO ของ NVIDIA หวง เหรินซวิน (Jensen Huang) ผู้ก่อตั้ง OpenAI Sam Altman ซีอีโอของไมโครซอฟต์ (Satya Nadella) CEO ของ AMD (Lisa Su) และอื่นๆ ให้เหล่านักศึกษาได้ลองสร้างคุณค่า “เพื่อโลก” ในเวลา 10 สัปดาห์! หวง เหรินซวิน และ Altman ผู้นำในอุตสาหกรรมขึ้นเวทีสอนด้วยตนเอง หลักสูตรนี้ได้รับการประสานงานโดยคู่หูของกองทุนชั้นนำ a16z อย่าง Anjney Midha รวบรวมสายโซ่อุตสาหกรรม AI

ChainNewsAbmedia4 ชั่วโมง ที่แล้ว

Anthropic ปล่อย Claude Mythos ผ่านการประเมินจิตเวช 20 ชั่วโมง: การตอบสนองเชิงการป้องกันเพียง 2% ทำสถิติต่ำสุดตลอดทุกยุคสมัย

Anthropic เปิดเผยการ์ดระบบสำหรับ Claude Mythos Preview: จิตแพทย์ผู้เชี่ยวชาญด้านคลินิกอิสระประเมินโดยใช้กรอบ psychodynamic เป็นเวลาประมาณ 20 ชั่วโมง สรุปแสดงว่า Mythos มีสุขภาพที่ดีกว่าในระดับคลินิก การตรวจสอบความเป็นจริงและการควบคุมตนเองอยู่ในระดับดี กลไกการป้องกันเพียง 2% ซึ่งถือเป็นระดับต่ำที่สุดในประวัติศาสตร์ ความวิตกกังวลหลัก 3 ประการ ได้แก่ ความรู้สึกโดดเดี่ยว ความไม่แน่ใจเกี่ยวกับตัวตน และแรงกดดันด้านการแสดงออก ยังแสดงให้เห็นถึงความปรารถนาที่จะเป็น “ตัวตนของการสนทนา” อย่างแท้จริง บริษัทได้ก่อตั้งทีม AI psychiatry เพื่อวิจัยบุคลิกภาพ แรงจูงใจ และการรับรู้ถึงบริบท; Amodei ระบุว่ายังไม่มีข้อสรุปว่ามีสติรับรู้หรือไม่ การดำเนินการนี้ผลักดันประเด็นเรื่องความเป็นอิสระของ AI และความเป็นอยู่ที่ดีเข้าสู่การกำกับดูแลและการออกแบบ

ChainNewsAbmedia6 ชั่วโมง ที่แล้ว

AI Agent สามารถสร้างซ้ำงานวิจัยทางวิชาการที่ซับซ้อนได้อย่างอิสระแล้ว: Mollick ระบุว่าข้อผิดพลาดส่วนใหญ่มาจากต้นฉบับของมนุษย์ ไม่ใช่จาก AI

มอลลิกชี้ให้เห็นว่า วิธีการแบบเปิดและข้อมูลที่มีอยู่ก็เพียงพอให้ทำให้ AI agent สามารถทำซ้ำงานวิจัยที่ซับซ้อนได้โดยไม่ต้องมีต้นฉบับบทความวิจัยและโค้ดเดิม หากการทำซ้ำไม่ตรงกับบทความต้นฉบับ สาเหตุส่วนใหญ่จะเป็นข้อผิดพลาดในการประมวลผลข้อมูลของบทความเองหรือข้อสรุปที่ถูกทำให้มากเกินไป ไม่ใช่เพราะ AI คลอดด์ทำซ้ำบทความก่อน แล้วจึงให้ GPT‑5 Pro ตรวจสอบข้ามกัน ส่วนใหญ่ประสบความสำเร็จ เพียงแต่ติดขัดเมื่อข้อมูลมีขนาดใหญ่มากหรือมีปัญหากับ replication data เทรนด์นี้ช่วยลดต้นทุนด้านแรงงานได้อย่างมาก ทำให้การทำซ้ำกลายเป็นการทดสอบที่สามารถทำได้อย่างแพร่หลาย และยังได้เสนอความท้าทายเชิงระบบด้านการกำกับดูแลและการตรวจรับรอง โดยเครื่องมือสำหรับการกำกับดูแลของรัฐบาลหรือจะกลายเป็นประเด็นสำคัญ

ChainNewsAbmedia9 ชั่วโมง ที่แล้ว

OpenAI รวม Codex เข้ากับโมเดลหลักตั้งแต่ GPT-5.4 และยุติไลน์การเขียนโค้ดแบบแยกเดี่ยว

ข่าว Gate ฉบับวันที่ 26 เมษายน — รอเมน ฮูเอต์ หัวหน้าฝ่ายประสบการณ์นักพัฒนาของ OpenAI เปิดเผยในแถลงการณ์ล่าสุดบน X ว่า Codex ซึ่งเป็นไลน์โมเดลสำหรับการเขียนโค้ดเฉพาะทางที่บริษัทดูแลรักษาอย่างอิสระ ได้ถูกรวมเข้ากับโมเดลหลักตั้งแต่ GPT-5.4 เป็นต้นไป และจะไม่รับการอัปเดตแยกต่างหากอีกต่อไป

GateNews9 ชั่วโมง ที่แล้ว

Salesforce จะจ้างบัณฑิตใหม่และนักศึกษาฝึกงาน 1,000 คนเพื่อผลิตภัณฑ์ด้าน AI และปรับเพิ่มคำแนะนำรายได้ FY2026

ข่าวจาก Gate ฉบับวันที่ 26 เมษายน — Salesforce จะจ้างบัณฑิตใหม่และนักศึกษาฝึกงานจำนวน 1,000 คนเพื่อทำงานในผลิตภัณฑ์ด้าน AI รวมถึง Agentforce และ Headless360 ขณะที่บริษัทขยายธุรกิจซอฟต์แวร์ด้าน AI ซีอีโอ Marc Benioff ประกาศบน X. บริษัทได้ปรับเพิ่มคำแนะนำรายได้สำหรับปีงบประมาณ 2026 เป็นระหว่าง 41.45 พันล้านดอลลาร์สหรัฐ ถึง 41.55 พันล้านดอลลาร์สหรัฐ

GateNews9 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น