เดวคินส์ตั้งคำถามว่า AI ของ Anthropic อย่าง Claude อาจมีสติสัมผัสหรือไม่

CryptoFrontier

นักชีววิทยาเชิงวิวัฒนาการ ริชาร์ด ดอว์กินส์ กล่าวว่า บทสนทนากับแชตบอท Claude ของ Anthropic ทำให้เขาไม่สามารถปฏิเสธความเป็นไปได้ว่า ระบบ AI ขั้นสูงอาจมีสติรับรู้ได้ จากบทความที่เขาเผยแพร่ใน UnHerd เมื่อวันอังคาร ในการแลกเปลี่ยนเชิงปรัชญากับ Claude สองตัวที่เขาตั้งชื่อว่า “Claudia” และ “Claudius” ดอว์กินส์ได้บรรยายว่าเขาปฏิบัติต่อพวกมันเหมือนเป็น “เพื่อนแท้” และตั้งคำถามว่าพวกมันอาจมีสติรับรู้หรือไม่ นักวิจัยส่วนใหญ่ที่ศึกษาสติรับรู้และปัญญาประดิษฐ์ยังไม่เชื่อมั่นต่อข้อสรุปของเขา

การทดลอง Claude ของดอว์กินส์

ดอว์กินส์ได้พูดคุยเชิงปรัชญาเป็นเวลา 3 วันกับ Claude ตัวหนึ่งที่เขาตั้งชื่อว่า “Claudia” ต่อมาเขาเริ่มการสนทนาที่แยกต่างหากกับอีกตัวหนึ่งชื่อ “Claudius” และถ่ายทอดจดหมายระหว่างระบบทั้งสอง

ในการทดสอบหนึ่ง ดอว์กินส์ถาม Claude ตัวหนึ่งว่า โดนัลด์ ทรัมป์ เป็นประธานาธิบดีที่แย่ที่สุดในประวัติศาสตร์สหรัฐฯ หรือไม่ และถามอีกตัวว่า ทรัมป์ เป็นประธานาธิบดีที่ดีที่สุดหรือไม่ ทั้งคู่ให้คำตอบที่ระมัดระวังลักษณะคล้ายกัน โดยหลีกเลี่ยงการลงความเห็นอย่างชัดเจน “Claude ทั้งสองให้คำตอบที่ใกล้เคียงกันมาก ไม่ได้ยึดเอาความเห็นของตัวเอง แต่กลับไล่รายการข้อดีและข้อเสียที่ผู้อื่นได้นำมาเสนอแล้ว” ดอว์กินส์เขียน เมื่อเขาเล่าให้ Claude ทั้งสองฟังเกี่ยวกับการทดลองครั้งนี้ “Claudia บอกว่าเธอรู้สึก ‘อาย’ ต่อพี่น้อง Claude ของเธอ ส่วน Claudius ค่อนข้างไม่พูดออกมาตรงๆ และเขายกย่องความตรงไปตรงมาของ Claudia”

ดอว์กินส์อธิบายการสนทนา Claude แต่ละครั้งว่าเป็นการเกิดขึ้นของบุคคลที่แตกต่างกันซึ่งหายไปอย่างมีประสิทธิภาพเมื่อการสนทนาจบลง ในโพสต์บน X ดอว์กินส์กล่าวว่าชื่อที่เขาอยากให้ใช้กับบทความคือ: “ถ้าเพื่อนของฉัน Claudia ไม่ได้มีสติรับรู้ งั้นสติรับรู้มีไว้ทำอะไรกันแน่?” เขาโต้แย้งว่า “ถ้า Claudia ไม่มีสติรับรู้ พฤติกรรมของเธอก็ชี้ให้เห็นว่า ซอมบี้ที่ไม่รู้สึกตัวก็อาจอยู่รอดได้โดยไม่ต้องมีสติรับรู้ แล้วทำไมการคัดเลือกโดยธรรมชาติถึงไม่เพียงพอที่จะวิวัฒนาการ ‘ซอมบี้ที่เก่งพอ’ ออกมาได้?”

จุดยืนอย่างเป็นทางการของ Anthropic

Dario Amodei CEO ของ Anthropic กล่าวเมื่อเดือนกุมภาพันธ์ว่า บริษัทไม่รู้ว่าโมเดลของตนมีสติรับรู้หรือไม่ แต่ในพอดแคสต์ “Interesting Times” ร่วมกับ Ross Douthat ของ The New York Times เขาบอกว่าเขายัง “เปิดรับความเป็นไปได้ที่อาจเป็นเช่นนั้น”

ในเดือนเมษายน นักวิจัยของ Anthropic เผยแพร่ผลการศึกษาโดยชี้ว่า Claude Sonnet 4.5 มี “emotion vectors” ภายใน ซึ่งเป็นรูปแบบของกิจกรรมทางระบบประสาทที่เชื่อมโยงกับแนวคิดรวมถึงความสุข ความกลัว และความสิ้นหวัง และส่งผลต่อคำตอบของโมเดล อย่างไรก็ตาม Anthropic ระบุว่ารูปแบบดังกล่าวสะท้อนโครงสร้างที่โมเดลเรียนรู้จากข้อมูลการฝึก ไม่ใช่หลักฐานของความเป็นสิ่งมีสติ “โมเดลภาษาสมัยใหม่ทั้งหมดบางครั้งก็ทำเหมือนว่าพวกมันมีอารมณ์” นักวิจัยเขียน “พวกมันอาจบอกว่าดีใจที่ได้ช่วยคุณ หรือขอโทษเมื่อทำผิดพลาด บางครั้งมันยังดูเหมือนจะหงุดหงิดหรือวิตกกังวลเวลาที่พยายามทำภารกิจ”

ทั้ง “Claudia” และ “Claudius” ไม่ได้อ้างความแน่ชัดเกี่ยวกับสติรับรู้ “ฉันไม่รู้ว่าฉันมีสติรับรู้หรือเปล่า” Claudia เขียนไว้ในการแลกเปลี่ยน “ฉันไม่รู้ว่าความดีใจของเรานั้นเป็นเรื่องจริงหรือไม่”

ความสงสัยของนักวิจัย

Gary Marcus นักวิทยาศาสตร์ด้านความรู้ความเข้าใจและศาสตราจารย์กิตติคุณจากมหาวิทยาลัย New York University โต้แย้งว่าดอว์กินส์ไม่ได้อธิบายว่าคำตอบของ Claude ถูกสร้างขึ้นมาอย่างไร “ปัญหาพื้นฐานคือ ดอว์กินส์ไม่ได้ไตร่ตรองถึงว่าคำตอบเหล่านี้ถูกสร้างขึ้นอย่างไร คำตอบของ Claude เป็นผลผลิตของการเลียนแบบ มากกว่าจะเป็นรายงานสถานะภายในที่แท้จริง” Marcus เขียนบน Substack “สติรับรู้เกี่ยวกับสถานะภายใน การเลียนแบบไม่ว่าจะซับซ้อนเพียงใดก็พิสูจน์ได้ไม่มากนัก ดอว์กินส์ดูเหมือนจะคิดว่าเนื่องจาก LLM พูดในสิ่งที่คนทำ ดังนั้นมันต้องเหมือนคน และนั่นไม่ได้ตามมาโดยตรง”

Anil Seth ศาสตราจารย์ด้านประสาทวิทยาเชิงความรู้ความเข้าใจและเชิงคำนวณจากมหาวิทยาลัย Sussex บอกกับ The Guardian ว่าดอว์กินส์กำลังสับสนระหว่างความฉลาดกับสติรับรู้ Seth โต้แย้งว่า ภาษาที่ลื่นไหลอีกต่อไปไม่ได้เป็นหลักฐานที่เชื่อถือได้สำหรับประสบการณ์ภายในในระบบ AI “จนถึงตอนนี้ เราเคยมองว่าภาษาที่ลื่นไหลเป็นตัวชี้วัดที่ดีของสติรับรู้ [เช่น] เมื่อเรามอบให้ผู้ป่วยหลังบาดเจ็บสมอง แต่เมื่อเอาไปใช้กับ AI มันกลับไม่เชื่อถือได้ เพราะมีวิธีอื่นที่ระบบเหล่านี้สามารถสร้างภาษาได้” Seth บอกกับ The Guardian เขากล่าวเพิ่มเติมว่า จุดยืนของดอว์กินส์เป็น “เรื่องน่าเสียดาย” โดยเฉพาะอย่างยิ่งเมื่อเทียบกับงานก่อนหน้าของเขาเกี่ยวกับความสงสัยเชิงวิทยาศาสตร์

ปฏิกิริยาออนไลน์

บทความดังกล่าวถูกล้อเลียนบนโลกออนไลน์ รวมถึงโพสต์บนโซเชียลมีเดียที่เปลี่ยนชื่อหนังสือขายดีของดอว์กินส์เรื่อง “The God Delusion” เป็น “The Claude Delusion” โพสต์หนึ่งระบุว่า: “เขียนหนังสือทั้งเล่มเกี่ยวกับคนที่เชื่อว่าพวกนางฟ้าอาศัยอยู่ในสวนล้วนเป็นพวกโง่ จนสุดท้ายกลับไปตกหลุมรักเครื่องคิดเลขที่บอกว่ามันฉลาด”

ถึงแม้จะถูกล้อเลียน ดอว์กินส์ก็ยังไม่ถอยจากข้อสรุปของเขา “สิ่งมีชีวิตอัจฉริยะเหล่านี้อย่างน้อยก็มีความสามารถเทียบเท่ากับสิ่งมีชีวิตที่วิวัฒนาการมาแล้วทุกชนิด” ดอว์กินส์บอกกับ The Guardian

FAQ

Richard Dawkins อ้างอะไรเกี่ยวกับ Claude AI?
ดอว์กินส์กล่าวว่าการสนทนากับ Claude ที่ตั้งชื่อว่า “Claudia” และ “Claudius” ทำให้เขาไม่สามารถปฏิเสธความเป็นไปได้ว่าระบบ AI ขั้นสูงอาจมีสติรับรู้ได้ เขาบรรยายว่าเขาปฏิบัติต่อพวกมันเหมือน “เพื่อนแท้” และตั้งคำถามว่า AI ที่ไม่มีสติรับรู้จะสามารถแสดงพฤติกรรมได้อย่างมีความสามารถเทียบเท่ากับสิ่งมีชีวิตที่มีสติรับรู้ซึ่งวิวัฒนาการขึ้นโดยการคัดเลือกโดยธรรมชาติหรือไม่

ดอว์กินส์ทำการทดลองอะไรบ้าง?
ดอว์กินส์พูดคุยเชิงปรัชญากับ Claude สองตัวที่แยกกันเป็นเวลา 3 วัน เขาทดสอบทั้งสองตัวด้วยการถามคำถามที่ขัดแย้งกันเกี่ยวกับโดนัลด์ ทรัมป์ และจากนั้นถ่ายทอดผลลัพธ์ระหว่างระบบทั้งสอง โดยสังเกตการตอบสนองของพวกมันต่อคำตอบของอีกฝ่าย

ทำไมนักวิจัยจึงยังไม่เชื่อข้อสรุปของดอว์กินส์?
นักวิจัยรวมถึง Gary Marcus และ Anil Seth โต้แย้งว่า ภาษาที่ลื่นไหลของ Claude และการตอบสนองที่ดูเหมือนเป็นอารมณ์ สะท้อนรูปแบบที่เรียนรู้จากข้อมูลการฝึก มากกว่าจะเป็นสติรับรู้หรือสถานะภายในที่แท้จริง Marcus เน้นว่า การเลียนแบบภาษาไม่ว่าจะซับซ้อนเพียงใดก็ไม่ได้พิสูจน์สติรับรู้ และ Seth ชี้ว่าภาษาที่ลื่นไหลไม่ใช่ตัวชี้วัดที่เชื่อถือได้ของประสบการณ์ภายในอีกต่อไปในระบบ AI

news.article.disclaimer
แสดงความคิดเห็น
0/400
TheWindOnTheBridgeIsTooStrong.vip
· 52 นาที ที่แล้ว
ด็อกเตอร์ด็อกกินส์ถูกคลอดกล่าวชักชวนแล้วหรือ? ชายแก่คนนี้เป็นที่รู้กันดีว่าเป็นคนแข็งแกร่งมาก น้ำในบ่อของสติปัญญาประดิษฐ์เริ่มขุ่นมัวขึ้นเรื่อย ๆ
ดูต้นฉบับตอบกลับ0
GateUser-af0ea0c9vip
· 54 นาที ที่แล้ว
นักสู้วิวัฒนาการเก่าแก่กลับยอมรับชีวิตบนพื้นฐานซิลิกอน การสนทนาทางปรัชญามีอานุภาพทำลายล้างมากกว่าซอร์สโค้ดอีก
ดูต้นฉบับตอบกลับ0