المؤلف: Moonshot
في عام 1947 ، أشار آلان تورينغ في إحدى خطاباته إلى “ما نريده هو آلة يمكنها التعلم من التجربة”.
بعد 78 عامًا ، تم منح جائزة تورينغ ، التي تحمل اسمًا تورينغ وتعرف باسم “جائزة نوبل في عالم الحوسبة” ، لعالمين قضيا حياتهما في حل مشكلة تورينغ هذه.
حصل كل من أندرو بارتو (Andrew Barto) وريتشارد ساتون (Richard Sutton) على جائزة تورينج لعام 2024، وهما معلم وتلميذ يبلغان من العمر تسع سنوات، وهما مؤسسا تقنية AlphaGo وChatGPT، وهما رواد تقنية في مجال التعلم الآلي.
الفائزون بجائزة تورينغ أندرو بارتو (Andrew Barto) وريتشارد ساتون (Richard Sutton)
مصدر الصورة: موقع جوائز تورينغ
كتب جيف دين، العالم المشارك في جوجل، في كلمته في حفل توزيع الجوائز: “تقنية التعلم التقويي التي ابتكرها بارتو وساتون تجيب مباشرة على سؤال تورينج. عملهما كان حاسماً في تطور الذكاء الاصطناعي خلال العقود الماضية. الأدوات التي طوروها ما زالت ركيزة ازدهار الذكاء الاصطناعي… جوجل فخورة برعاية جائزة ACM A.M. تورينج.”
الجائزة الوحيدة بقيمة 1000000 دولار هي جوائز تورينغ والتي يرعاها جوجل.
وبعد الفوز، يشير العالمان اللذان يقفان تحت الأضواء إلى شركات AI الكبرى، حيث يصدرون ‘كلمات الفوز’ لوسائل الإعلام: الشركات الحالية للذكاء الاصطناعي تعتمد على ‘الحوافز التجارية’ بدلاً من التركيز على البحث التقني، وتضع في المجتمع ‘جسرًا غير مختبر ليمر الناس ويختبروا.’
ليس هناك استثناء، وكانت آخر مرة حصل فيها علماء في مجال الذكاء الاصطناعي على جائزة تورينغ في فعاليات عام 2018، جوشوا بينيو، وجيفري هينتون، وليكون يانغ حصلوا على الجائزة بسبب إسهاماتهم في مجال التعلم العميق.
الفائزون بجائزة تورنغ لعام 2018
مصدر الصورة: eurekalert
حيث دعا جوشوا بينهيو وجيفري سينتون (الفائزان بجائزة نوبل للفيزياء لعام 2024)، المعروفان باسم “آباء الذكاء الاصطناعي”، في السنتين الأخيرتين في موجة الذكاء الاصطناعي، إلى التحذير بشكل متكرر من سوء استخدام الشركات الكبيرة للذكاء الاصطناعي في المجتمع العالمي والعالم العلمي.
جيفري سينتون ترك جوجل مباشرة أيضًا ليتمكن من التحدث بحرية ، وفاز هذه المرة سانتون ، الذي شغل أيضًا منصب عالم أبحاث في DeepMind من عام 2017 إلى 2023.
عندما يتم منح أعلى شرف في عالم الحوسبة مرارًا وتكرارًا لرواد تقنية الذكاء الاصطناعي، يبدأ ظاهرة مثيرة للاهتمام تظهر تدريجيًا:
لماذا يقوم هؤلاء العلماء الذين يقفون على قمة الجبل دائمًا بدورهم تحت الأضواء بقرع جرس إنذار الذكاء الاصطناعي؟
صانع الجسور الذكي
إذا كان آلان تورينج هو من يقود الذكاء الاصطناعي، فإن أندرو بارتو وريتشارد ساتون هما “بناة الجسور” على هذا الطريق.
في وقت سباق الذكاء الاصطناعي، بعد أن حصلوا على الثناء، هل يمكن لجسورهم التي بنوها أن تحمل مرور البشر بأمان؟
ربما تكمن الإجابة الصحيحة في مسيرتهم الأكاديمية التي امتدت على مدى نصف قرن - فقط من خلال العودة إلى كيف بنوا ‘تعلم الآلة’، يمكن فهم سبب حذرهم من ‘فقدان السيطرة التقنية’.
مصدر الصور: جامعة كارنيجي ميلون
في عام 1950، قدم آلان تورينج في مقالته الشهيرة “الحاسوب والذكاء” مشكلة فلسفية وتقنية في بدايتها:
هل يمكن للآلة التفكير؟
بناءً على ذلك، صمم تيورينج “لعبة المحاكاة” المعروفة لاحقًا بـ “اختبار تيورينج”.
في الوقت نفسه، أشار تورينغ إلى أن الذكاء الاصطناعي يمكن أن يتحقق من خلال التعلم، بدلاً من الاعتماد فقط على البرمجة المسبقة. وقد تصور مفهوم “الطفل الآلي”، أي تدريب الآلة لتعلم تدريجي مثل الطفل من خلال التدريب والتجربة.
الهدف الأساسي للذكاء الاصطناعي هو بناء كائن ذكي قادر على التحسس واتخاذ إجراءات أفضل، ومعيار قياس الذكاء هو قدرة الكائن الذكي على تقييم “بعض الإجراءات أفضل من الأخرى”.
الهدف من التعلم الآلي هو تقديم ردود فعل مناسبة للآلة بعد العمل، وتمكين الآلة من التعلم بشكل مستقل من الخبرة الناتجة عن هذه الردود. وبعبارة أخرى، فإن فكرة تورينج لأساليب التعلم الآلي القائمة على المكافآت والعقوبات ليست مختلفة عن تدريب الكلاب لدى بافلوف.
أصبحت أقوى كلما خسرت أكثر في اللعبة، وهو نوع من ‘التعلم التعزيزي’
مصدر الصورة: zequance.ai
طريقة التعلم الآلي التي تم تقديمها بواسطة تورينج، لم يتم بناؤها حتى بعد ثلاثين عامًا من قبل زوج من المعلمين والتلاميذ - التعلم التعزيزي (RL).
في عام 1977، بدأ أندرو بارتو، مستوحى من علم النفس وعلم الأعصاب، استكشاف نظرية جديدة للذكاء البشري: أن الخلايا العصبية تشبه “الهواة للمتعة”، حيث يحاول كل من مليارات الخلايا العصبية في الدماغ البشري تعظيم السعادة (المكافأة) وتقليل الألم (العقاب). وبالإضافة إلى ذلك، لا تقوم الخلايا العصبية بتلقي الإشارات ونقلها آليًا، بل إذا أدى نمط نشاط معين لخلية عصبية ما إلى ردود فعل إيجابية، فإنها ستميل إلى تكرار هذا النمط، وبالتالي تدفع عملية تعلم الإنسان.
في عقد 1980، أخذ بارتو معه طالب الدكتوراه ريتشارد ساتون، وقام بتطبيق نظريته للخلايا العصبية التي تعتمد على “التجربة المستمرة وضبط الاتصال استنادًا إلى التغذية الراجعة للعثور على النمط السلوكي الأمثل” في مجال الذكاء الاصطناعي، ومن هنا جاء التعلم التقويي.
كتاب ‘تعزيز التعلم: مقدمة’ أصبح كتابًا كلاسيكيًا وتمت استشهاده ما يقرب من 80000 مرة
مصدر الصورة: IEEE
استفاد الزوجان من الطالب والمعلم من الأساسيات الرياضية لعملية اتخاذ القرارات في عملية ماركوف ، وقد قاما بتطوير وكتابة العديد من خوارزميات التعلم التعزيزي الأساسية ، وبنوا بنجاح إطار نظري للتعلم التعزيزي ، وكتبا كتابًا تعليميًا بعنوان “التعلم التعزيزي: مقدمة” ، مما جعل الآلاف من الباحثين يدخلون مجال التعلم التعزيزي ، ويعتبر الاثنان والدهان للتعلم التعزيزي.
والغرض من دراستهم للتعلم التعزيزي هو استكشاف أساليب التعلم الآلي الفعالة والدقيقة والتي تعمل على تحقيق أقصى عائد وأفضل إجراء.
الإله الواحد للتعلم التعزيزي
إذا كان التعلم الآلي هو نوع من التعلم القسري ، فإن التعلم التعزيزي هو نوع من التعلم الطبيعي.
التعلم الآلي التقليدي هو إطعام النموذج بكميات كبيرة من البيانات الموسومة، لإنشاء علاقة تطابقية ثابتة بين المدخلات والمخرجات. أحد السيناريوهات الأكثر كلاسيكية هو إظهار مجموعة من الصور للكمبيوتر، وإخباره أي صورة تحتوي على قطة وأي صورة تحتوي على كلب، بمجرد تقديم ما يكفي من الصور، سيتمكن الكمبيوتر من التعرف على القطط والكلاب.
من ناحية أخرى ، فإن التعلم المعزز في حالة عدم وجود توجيه واضح ، تقوم الآلة بضبط السلوك تدريجيا لتحسين النتائج من خلال آليات التجربة والخطأ والمكافأة والعقاب. تماما مثل الروبوت الذي يتعلم المشي ، فإنه لا يحتاج إلى أن يستمر البشر في إخباره “هذه الخطوة صحيحة ، وهذه الخطوة خاطئة” ، بل يحتاج فقط إلى المحاولة ، والسقوط ، والتكيف ، وفي النهاية سيكون قادرا على المشي ، وحتى الخروج من مشيته الفريدة.
من الواضح أن مبدأ التعلم التعزيزي أقرب إلى الذكاء البشري، تمامًا كما يتعلم كل طفل رضيع المشي من خلال السقوط، ويتعلم الإمساك من خلال التجربة، ويتمسك بالمقاطع الصوتية من خلال التلاعب بها، ويتعلم اللغة.
وراء “روبوت ركلة الدوران” المشتعل أيضًا تدريب التعزيز
مصدر الصور: Yu Shu Technology
لحظة الذروة في التعلم التعزيزي هي عندما قام AlphaGo في عام 2016 بـ “يد إلهية”. في ذلك الوقت، في المباراة بين AlphaGo ولي سي دونغ، وضع AlphaGo خطوة بيضاء في اليد 37 التي أدهشت الجميع، حيث عكست هذه الخطوة الموقف السيء، وفازت بلي سي دونغ بمرة واحدة.
لم يتوقع أعلى الخبراء والمعلقين في عالم القواعد أن AlphaGo سيقوم باللعب في هذا الموقع، لأنه في تجربة اللاعبين البشر، كانت هذه الخطوة “غامضة”، واعترف لي سي سوك بعد المباراة أنه لم يفكر تماما في هذا النوع من اللعب.
AlphaGo لم يعتمد على حفظ الحركات الخاطئة للشطرنج لاكتساب “لمسة الإله”، بل جاءت تلك الحركات بعد عدد لا يحصى من الألعاب ضد نفسه، حيث استكشف الذاتي الأخطاء، ووضع خطط طويلة المدى، وحسن من استراتيجياته، وهذا هو جوهر التعلم التعزيزي.
تم إخلاء السبيل لي سيو شي، الذي تم تعطيل إيقاعه بواسطة AlphaGo “يد إلهية”
مصدر الصورة: AP
التعلم التعزيزي حتى تتحول الطاولة وتؤثر على ذكاء الإنسان، تماما كما بدأ اللاعبون بدراسة وبحث طرق الذكاء الاصطناعي للعب القدم عندما كشف AlphaGo عن “يد الإله”. العلماء أيضا يحاولون فهم آلية تعلم الدماغ البشري باستخدام خوارزميات ومبادئ التعلم التعزيزي، وأحد نتائج أبحاث بايتو وسانتو هو بناء نموذج حسابي لشرح دور الدوبامين في اتخاذ القرارات والتعلم عند البشر.
وبالإضافة إلى ذلك، فإن التعلم التعزيزي ماهر بشكل خاص في التعامل مع بيئات ذات قوانين معقدة وحالات متغيرة بشكل كبير، والعثور على الحل الأمثل فيها، مثل لعبة القطة والفأر، والقيادة الآلية، والتحكم في الروبوتات، والتحدث مع البشر بطريقة غامضة.
هذه هي المجالات التطبيقية للذكاء الاصطناعي الأكثر تطوراً وشعبية في الوقت الحالي، خاصة في نماذج اللغة الكبيرة، حيث يستخدم تقريبًا جميع النماذج الرائدة للغة الكبيرة أسلوب تدريب RLHF (تعزيز التعلم من خلال ردود فعل البشر)، وهو يتضمن تقييم الإجابات الخاصة بالنموذج من قبل البشر، ثم يقوم النموذج بتحسين نفسه بناءً على هذه الردود.
ولكن هذا بالضبط ما يقلق باطو: بعد بناء الشركات الكبيرة للجسور، يتم اختبار سلامة الجسر عن طريق جعل الناس يسيرون ذهابًا وإيابًا على الجسر.
"بعد الفوز، قال باتو: ‘إن تقديم البرنامج مباشرة لملايين المستخدمين دون اتخاذ أي تدابير وقائية ليس من المسؤولية.’
“كان يجب أن يرافق تطور التكنولوجيا مراقبة وتجنب التأثيرات السلبية المحتملة، ولكنني لم أرى هذه الشركات المتخصصة في الذكاء الاصطناعي تحقيق ذلك حقًا.” أضاف.
هل يخشى الذكاء الاصطناعي العليا ما؟
تهديد الذكاء الاصطناعي لم ينته بعد، لأن العلماء يخافون بشدة من فقدان السيطرة على المستقبل الذي أسسوا له بأيديهم.
في “كلمة الفوز” لباتو وساندر، لم يكن هناك انتقاد لتقنية الذكاء الاصطناعي الحالية، بل كانت مليئة بعدم الرضا تجاه شركات الذكاء الاصطناعي.
حذر الجميع في المقابلات من أن تطور الذكاء الاصطناعي حاليًا يعتمد على شركات كبيرة تنافس في إطلاق نماذج قوية ولكن من السهل ارتكاب الأخطاء ، حيث جمعوا كميات كبيرة من الأموال من خلال ذلك ، ثم استمروا في استثمار عشرات المليارات من الدولارات في سباق تسلح الرقائق والبيانات.
جميع البنوك الكبرى تقوم بإعادة تقييم صناعة الذكاء الاصطناعي
مصدر الصورة: جولدمان ساكس
صحيح، وفقًا لدراسة بنك ألمانيا، فإن إجمالي استثمارات عمالقة التكنولوجيا في مجال الذكاء الاصطناعي تبلغ حوالي 3400 مليار دولار، وهذا الحجم قد تجاوز الناتج المحلي الإجمالي السنوي لليونان. تقدر قيمة شركة OpenAI بنحو 2600 مليار دولار، وهي تستعد حاليًا لإطلاق جولة استثمارية جديدة بقيمة 400 مليار دولار.
في الواقع، يتفق العديد من خبراء الذكاء الاصطناعي مع وجهة نظر باطو وسانتون.
سابقاً، أعرب القائد التنفيذي السابق لمايكروسوفت، ستيفن سينوفسكي، عن أن صناعة الذكاء الاصطناعي وقعت في مأزق توسعي، يتطلب التقدم التكنولوجي التضحية بالمال، وهذا لا يتماشى مع تاريخ تطور التكنولوجيا، حيث يتجه التكلفة نحو الانخفاض بدلاً من الارتفاع.
في 7 مارس ، أصدر الرئيس التنفيذي السابق لجوجل إريك شميدت ، مؤسس Scale AI ألكس وانج ، ومدير مركز الأمن الاصطناعي دان هندريكس مقالًا تحذيريًا مشتركًا.
يعتقد كبار التقنيين الثلاثة أن وضع التطوير الحالي في المجال الحدودي للذكاء الاصطناعي يشبه السباق النووي الذي ولد مشروع مانهاتن ، وأن شركات الذكاء الاصطناعي تنفذ بهدوء “مشروع مانهاتن” الخاص بها ، وتضاعف استثمارها في الذكاء الاصطناعي كل عام في العقد الماضي ، وإذا لم يعودوا يتدخلون في التنظيم ، فقد يصبح الذكاء الاصطناعي أكثر التقنيات غير المستقرة منذ القنبلة النووية.
“إستراتيجية الذكاء الاصطناعي الفائق” ومؤلفوها
مصدر الصورة: nationalsecurity.ai
بسبب العمق التعلم في عام 2019 تلقى جوشوا بينيو الجائزة التورنغ، وقد حذر في مدونته من أن صناعة الذكاء الاصطناعي اليوم لها تريليونات الدولارات قيمة متاحة لرأس المال لمطاردة والنهب، ولها تأثير كبير يمكن أن يفسد النظام العالمي الحالي.
يعتقد العديد من الأشخاص الذين يأتون من خلفيات تقنية أن صناعة الذكاء الاصطناعي الحالية قد انحرفت بالفعل عن البحث في التكنولوجيا، والنظر في الذكاء، واليقظة من سوء استخدام التكنولوجيا، وانتقلت نحو نمط رأسمالي كبير يتمثل في إلقاء الأموال لتكديس الرقائق.
قال باوتو في مقابلته بعد حصوله على الجائزة: “إن بناء مراكز بيانات ضخمة وجمع أموال المستخدمين ثم السماح لهم باستخدام برمجيات غير آمنة ليس هو الدافع الذي أوافق عليه.”
وفي النسخة الأولى من تقرير العلوم الدولي لأمان الذكاء الاصطناعي المتقدم، الذي كتبه 75 خبيرًا في الذكاء الاصطناعي من 30 دولة، يشير إلى أن الطرق التي تدير بها مخاطر الذكاء الاصطناعي العامة غالبًا ما تستند إلى افتراض معين: أن مطوري الذكاء الاصطناعي وصانعي السياسات يمكنهم تقييم قدرات نماذج وأنظمة الذكاء الاصطناعي العامة وتأثيراتها المحتملة بشكل صحيح. ومع ذلك، فإن الفهم العلمي لعمل وقدرات وتأثيرات الذكاء الاصطناعي العام على المستوى الاجتماعي في الواقع محدود للغاية.
تحذير طويل من يوشوا بن هيو
مصدر الصورة: Yoshua Bengio
لا يمكن إنكاره ، لقد نقلت “نظرية التهديد الذكي” اليوم تركيزها من التقنية إلى الشركات الكبيرة.
حذر الخبراء الشركات الكبيرة: أنتم تحرقون الأموال، تراكمون المواد، وتلتفون حول المعلمات، ولكن هل تعرفون حقًا المنتج الذي تطورونه؟ هذا هو أيضًا من أصل مقولة باتو وساندر بشأن “بناء الجسور”، لأن التكنولوجيا تنتمي إلى الإنسانية بأسرها، ولكن رأس المال ينتمي فقط للشركات الكبيرة.
بغض النظر عن مجال أبحاث باطو وساندتون الدائم: التعلم التعزيزي. إن مبدأه أكثر توافقًا مع الذكاء البشري، ويتمتع بسمة “صندوق أسود”، خاصة في التعلم التعزيزي العميق، حيث تصبح أنماط سلوك الذكاء الاصطناعي معقدة وصعبة التفسير.
هذا هو ما يثير قلق علماء الحاسوب: أن يكونوا قد ساهموا وشهدوا نمو الذكاء الاصطناعي، لكنهم يجدون صعوبة في تفسير نواياه.
وقد أثار الفائزون بجائزة تورينغ للذكاء الاصطناعي والتعلم التعميقي والتعلم التقويمي المخاوف حول تطور الذكاء الاصطناعي الشامل (AGI)، بينما لم يكنوا قلقين بشأن سباق التسلح بين الشركات الكبرى، الذي قد يؤدي في مجال AGI إلى “انفجار الذكاء”، والذي قد ينتج بطريق الخطأ عنه الذكاء الاصطناعي الفائق (ASI)، والفارق بين الاثنين ليس مسألة تقنية فقط، بل تتعلق بمستقبل حضارة البشرية.
ASI الذي يتجاوز الذكاء البشري، بحجم المعلومات التي يتحكم فيها، وسرعة اتخاذ القرارات، ومستوى التطور الذاتي، سيتجاوز بكثير نطاق فهم البشر، إذا لم يتم تصميم ASI وإدارته بحذر شديد، فقد يصبح نقطة تكنولوجية لا يمكن مقاومتها وأخطرها في تاريخ البشرية.
في ظل الجنون الحالي للذكاء الاصطناعي، قد يكون هؤلاء العلماء هم أكثر الأشخاص تأهيلاً لـ “رش الباردة”. بعد كل شيء، قبل خمسين عامًا، عندما كان الكمبيوتر لا يزال جهازًا ضخمًا، كانوا قد بدأوا البحث في مجال الذكاء الاصطناعي. لقد شكلوا الماضي ولديهم أيضًا موقف للشك في المستقبل.
سيواجه الزعماء الذين يقودون الذكاء الاصطناعي نهاية أوبنهايمر؟
مصدر الصورة: The Economist
في مقابلة مع مجلة The Economist في شهر فبراير، ذكر الرئيس التنفيذي لشركتي DeepMind و Anthropic:
سأظل مستيقظًا طوال الليل خوفًا من أن أصبح النسخة القادمة من أوبنهايمر.