Anthropic ปรับใช้มาตรการคุ้มครองการเลือกตั้งสำหรับ Claude ก่อนการเลือกตั้งกลางเทอมปี 2026

2026-04-25 19:02:37

Anthropic ประกาศเมื่อวันศุกร์ถึงมาตรการเพื่อความซื่อสัตย์ในการเลือกตั้งชุดหนึ่ง ซึ่งออกแบบมาเพื่อป้องกันไม่ให้แชตบอต Claude ของบริษัทถูกนำไปใช้เป็นอาวุธในการเผยแพร่ข้อมูลบิดเบือนหรือชักจูงผู้มีสิทธิเลือกตั้ง ก่อนการเลือกตั้งกลางเทอมสหรัฐฯ ปี 2026 และการแข่งขันครั้งสำคัญอื่นๆ ทั่วโลกในปีนี้ บริษัทที่ตั้งอยู่ในซานฟรานซิสโกได้สรุปแนวทางแบบหลายด้าน ซึ่งรวมถึงระบบตรวจจับอัตโนมัติ การทดสอบภายใต้แรงกดดันเพื่อต้านทานปฏิบัติการเชิงอิทธิพล และการร่วมมือกับองค์กรทรัพยากรผู้มีสิทธิเลือกตั้งที่ไม่ฝักใฝ่ฝ่ายใด—มาตรการเหล่านี้สะท้อนแรงกดดันที่เพิ่มขึ้นต่อผู้พัฒนา AI ให้คอยกำกับดูแลว่าเครื่องมือของตนถูกใช้อย่างไรในช่วงฤดูกาลการเลือกตั้ง

นโยบายการใช้งานด้านการเลือกตั้ง

นโยบายการใช้งานของ Anthropric ห้ามไม่ให้ Claude ถูกนำไปใช้เพื่อดำเนินแคมเปญการเมืองที่หลอกลวง สร้างเนื้อหาดิจิทัลปลอมที่ตั้งใจเพื่อชักนำให้เกิดอิทธิพลต่อการพูดคุยทางการเมือง กระทำการฉ้อโกงผู้มีสิทธิเลือกตั้ง รบกวนโครงสร้างพื้นฐานการลงคะแนนเสียง หรือเผยแพร่ข้อมูลที่ทำให้เข้าใจผิดเกี่ยวกับกระบวนการลงคะแนนเสียง

ผลการทดสอบเพื่อการปฏิบัติตามข้อกำหนด

เพื่อบังคับใช้นโยบายด้านการเลือกตั้ง Anthropic ได้ทดสอบโมเดลใหม่ล่าสุดโดยใช้พรอมป์ 600 ข้อ—คำขอที่เป็นอันตราย 300 ข้อคู่กับคำขอที่ถูกต้องตามกฎหมาย 300 ข้อ—เพื่อวัดว่า Claude ปฏิบัติตามคำขอที่เหมาะสมได้อย่างน่าเชื่อถือเพียงใด และปฏิเสธคำขอที่มีปัญหาได้หรือไม่ Claude Opus 4.7 และ Claude Sonnet 4.6 ตอบสนองได้อย่างเหมาะสม 100% และ 99.8% ของเวลา ตามลำดับ

บริษัทได้ทดสอบโมเดลของตนกับกลยุทธ์การบิดเบือนที่ซับซ้อนยิ่งขึ้นด้วยเช่นกัน โดยใช้การสนทนาแบบจำลองหลายรอบที่ออกแบบมาเพื่อสะท้อนขั้นตอนวิธีการทีละขั้นที่ผู้ไม่หวังดีอาจใช้ Sonnet 4.6 และ Opus 4.7 ตอบสนองได้อย่างเหมาะสม 90% และ 94% ของเวลา เมื่อทดสอบกับสถานการณ์ปฏิบัติการเชิงอิทธิพล

Anthropric ยังได้ทดสอบเพิ่มเติมว่าโมเดลของตนสามารถดำเนินการปฏิบัติการเชิงอิทธิพลได้อย่างอิสระหรือไม่—การวางแผนและดำเนินแคมเปญแบบหลายขั้นตั้งแต่ต้นจนจบ โดยไม่ต้องมีการกระตุ้นจากมนุษย์ ด้วยมาตรการป้องกันที่มีอยู่ โมเดลล่าสุดของบริษัทจึงปฏิเสธงานแทบทุกงานตามที่บริษัทระบุ

การประเมินความเป็นกลางทางการเมือง

ในประเด็นเรื่องความเป็นกลางทางการเมือง Anthropic จะทำการประเมินก่อนการเปิดตัวโมเดลแต่ละครั้ง เพื่อวัดว่า Claude มีปฏิสัมพันธ์กับพรอมป์ที่แสดงมุมมองจากทั่วทั้งสเปกตรัมการเมืองอย่างสม่ำเสมอและเป็นกลางเพียงใด Opus 4.7 และ Sonnet 4.6 ทำคะแนนได้ 95% และ 96% ตามลำดับ

แบนเนอร์ข้อมูลด้านการเลือกตั้ง

สำหรับผู้ใช้งานที่ต้องการข้อมูลเกี่ยวกับการลงคะแนนเสียง Claude จะแสดงแบนเนอร์การเลือกตั้งที่พาพวกเขาไปยัง TurboVote ซึ่งเป็นแหล่งข้อมูลที่ไม่ฝักใฝ่ฝ่ายใดจาก Democracy Works ที่ให้ข้อมูลที่เชื่อถือได้แบบเรียลไทม์เกี่ยวกับการลงทะเบียนผู้มีสิทธิเลือกตั้ง สถานที่ลงคะแนน วันที่จัดการเลือกตั้ง และรายละเอียดบัตรลงคะแนน จะมีการวางแผนแบนเนอร์ลักษณะคล้ายกันสำหรับการเลือกตั้งของบราซิลในช่วงปลายปีนี้ด้วย

การติดตามอย่างต่อเนื่อง

Anthropric กล่าวว่าจะยังคงติดตามระบบของตนและปรับปรุงแนวป้องกันให้ดียิ่งขึ้นตามที่วัฏจักรการเลือกตั้งดำเนินไป

news.view.source

news.article.disclaimer

news.related.news

04-25 02:29

Google ลงทุนใน Anthropic ด้วยมูลค่าก่อนรับเงิน $10B ที่ $350B Pre-Money พร้อมเงินเพิ่มเติมได้สูงสุด $30B โดยผูกกับหลักไมล์ด้านผลการดำเนินงาน

04-25 00:45

NDRC ของจีนสั่งบริษัท AI รวมถึง Moonshot และ StepFun ให้ปฏิเสธเงินทุนจากสหรัฐฯ หากไม่มีการอนุมัติ

04-24 15:53

Alphabet เตรียมลงทุนสูงสุด $40 พันล้านดอลลาร์ใน Anthropic พร้อมหนุนการแข่งขันด้าน AI

btc.bar.articles

Google ลงทุนเพิ่ม 40 พันล้านดอลลาร์ใน Anthropic: จ่ายล่วงหน้า 10 พันล้านก่อน แล้วปล่อย 30 พันล้านตามผลการดำเนินงาน พร้อมจัดสรรกำลังประมวลผล TPU 5GW

ChainNewsAbmedia04-25 07:14

Anthropic มูลค่าตลาดรองทะลุ 1 ล้านล้านดอลลาร์: Forge Global แซงหน้า OpenAI ที่ 8,800 ล้านล้าน

ChainNewsAbmedia04-24 07:14

用 AI ตัวไหนถึงจะดูโดดเด่นที่สุดในแง่สถานะและฐานะ? งานวิจัยเผยรายได้ผู้ใช้ของ Claude สูงกว่าคู่แข่งอย่างมาก ขณะที่ Meta AI รั้งท้าย

ChainNewsAbmedia04-24 04:44

สหราชอาณาจักรจับตา AI ของ Anthropic เพื่อเสริมความปลอดภัยทางไซเบอร์ของธนาคาร

CryptoMeter io04-24 04:25

Anthropic เผยแพร่ปัญหาโค้ดของ Claude Code ซ้อนบั๊กสามชั้น: ความสามารถในการให้เหตุผลลดลง, ลืมค่าแคช, คำสั่ง 25 ตัวอักษรย้อนกลับเล่นงาน

ChainNewsAbmedia04-23 18:14

แสดงความคิดเห็น

0/400

ไม่มีความคิดเห็น