في الحلقة الأخيرة من 《All-In Podcast》، كشف المضيفون الأربعة أن OpenAI توصلت إلى اتفاق تعاون هام مع شركة Cerebras الناشئة في مجال شرائح الذكاء الاصطناعي الأمريكية، حيث ستقوم خلال الثلاث سنوات القادمة بشراء قدرة حوسبة تصل إلى 750 تيراواط في الساعة، وهو ما يعادل حجمًا كبيرًا من الطاقة، ويقارب مستوى المليارات من الدولارات. لم يكن هدف هذه الصفقة تدريب النماذج، بل التركيز على الحلقة الحاسمة في تجارية الذكاء الاصطناعي: (الاستنتاج)، وهو القدرة على تقديم استجابات وخدمات فورية من قبل النماذج. وأشار الأربعة إلى أن هذا يرمز إلى أن المنافسة في صناعة الذكاء الاصطناعي تتجه تدريجيًا من “من يدرب أكبر نموذج” إلى “من يستطيع تقديم أسرع وأكثر استقرارًا وأكثر كفاءة من حيث التكلفة في الاستنتاج”.
عقد قدرة 750 تيراواط في الساعة خلال ثلاث سنوات، OpenAI تضع خطة للاستنتاج
ذكر البرنامج أن OpenAI وعدت خلال ثلاث سنوات بشراء ما يصل إلى 750 تيراواط في الساعة من موارد الحوسبة من Cerebras، وهو ما يعادل حجم محطة توليد كهرباء كبيرة، لدعم تشغيل أنظمة الذكاء الاصطناعي في مرحلة التطبيق الفعلي.
وأكد المضيفون أن هذه الشراكة ليست بهدف تدريب نماذج جديدة، بل لدعم استجابات الاستنتاج الفورية لخدمات ChatGPT وواجهات برمجة التطبيقات والتطبيقات المختلفة للذكاء الاصطناعي. مع تزايد عدد المستخدمين وتوسع سيناريوهات الاستخدام، فإن القدرة الحاسوبية المطلوبة للاستنتاج ستتجاوز بكثير تلك المطلوبة خلال مرحلة تدريب النماذج.
تقنية Cerebras تختلف، حيث تصنع شريحة من كامل الرقاقة
قدم الضيوف أن Cerebras منذ تأسيسها اختارت مسارًا مختلفًا تمامًا عن تصميم الشرائح التقليدي، حيث يتم قطع الرقاقة إلى العديد من الشرائح الصغيرة، ثم يتم تجميعها في حزمة، بينما Cerebras تصمم الرقاقة كاملة كقطعة واحدة ضخمة، وتدمج عليها وحدات حساب وذاكرة بشكل مكثف.
هذا التصميم يقلل بشكل كبير من المسافة الفيزيائية بين وحدات الحساب والذاكرة، مما يقلل من الحاجة لنقل البيانات بين شرائح متعددة، ويخفض من تعقيد النظام، ويساعد على تحسين الكفاءة الإجمالية للحوسبة.
Cerebras تركز على تقليل الكمون، وتولي أهمية للسرعة في سيناريوهات الاستنتاج
أشار البرنامج إلى أن المؤشرات الرئيسية في مرحلة الاستنتاج تتعلق بسرعة الاستجابة، وأداء الكمون، واستقرار النظام. بعد إرسال المستخدم للأمر، يجب على النموذج إتمام الحسابات وإرجاع النتائج على الفور، وأي تأخير يؤثر مباشرة على تجربة المستخدم.
نظرًا لأن Cerebras تركز على تجميع قدر كبير من الحوسبة والذاكرة في شريحة ضخمة واحدة، فإن البيانات تتنقل على مسافات قصيرة جدًا، مما يجعلها مثالية لسيناريوهات الاستنتاج التي تتطلب تكرارًا عاليًا واستجابة منخفضة الكمون.
ذكر البرنامج أن أول من استخدم نظام Cerebras على نطاق واسع هم مؤسسات في الشرق الأوسط، بما في ذلك الجهات المعنية في الإمارات، وبعد النشر الفعلي، أظهرت أداءً واضحًا في سرعة الاستنتاج في مهام معينة.
OpenAI تنوع سلسلة التوريد، لتجنب مخاطر الاعتماد على مزود واحد
أشار المضيفون إلى أن OpenAI اتبعت استراتيجية “تعدد الموردين” بشكل واضح في السنوات الأخيرة، ولم تعد تعتمد بشكل كامل على شركة شرائح واحدة.
حاليًا، تستخدم OpenAI بشكل كبير قدرات NVIDIA، وتتعاون أيضًا مع AMD، والآن أدخلت Cerebras، لتشكيل مسارات متعددة لتوريد القدرة الحاسوبية. الهدف هو تنويع المخاطر، وتجنب تأثير تغييرات القدرة الإنتاجية أو الأسعار أو السياسات لمورد واحد على استقرار الخدمة بشكل عام.
وصف البرنامج ذلك بأنه نوع من “اللعب غير المركزي” في سلسلة التوريد للقدرة الحاسوبية، لضمان استمرار الخدمة حتى في حال ظهور مشكلة في أحد المسارات.
صناعة الشرائح السيليكونية تعيد ترتيب أوراقها، وظهور شركات ناشئة جديدة
اعتقد المضيفون أن هذه الشراكة ليست مجرد تعديل في استراتيجية OpenAI، بل ترمز إلى أن صناعة شرائح الذكاء الاصطناعي تدخل دورة جديدة من المنافسة.
على مدى العشر إلى العشرين سنة القادمة، قد تتكرر مشهدية التنافس بين العديد من الشركات في صناعة الحواسيب الشخصية في بداياتها، حيث لن تقتصر المنافسة على الشركات الكبرى فقط، بل قد تجد العديد من الفرق الناشئة مكانًا لها في مجالات شرائح الاستنتاج، والقدرات المخصصة، والشرائح التطبيقية الرأسية.
وفي ظل استمرار الطلب على تجارية الذكاء الاصطناعي، طالما كانت التقنية تتجه في الاتجاه الصحيح، فإن الشركات الصغيرة الناشئة لا تزال تملك فرصة للظهور بسرعة في الصناعة.
تحول مركز الصناعة، من سباق التدريب إلى منافسة الاستنتاج
اختتم البرنامج بالتلخيص، أن بداية تطور الذكاء الاصطناعي كانت تركز على من يستطيع تدريب أكبر وأقوى النماذج، لكن مع تطبيقاتها العملية، فإن العامل الحاسم سيكون من يستطيع تقديم خدمات الاستنتاج بسرعة أكبر، وتكلفة أقل، واستقرار أعلى.
تُعتبر شراكة OpenAI مع Cerebras مؤشرًا هامًا على تحول الصناعة، وتُظهر أن المنافسة في الذكاء الاصطناعي تتجه تدريجيًا من “حجم التدريب” إلى “كفاءة الاستنتاج”.
(《All-In Podcast》تتوقع 2026: الذكاء الاصطناعي والنحاس والكهرباء تصبح المحاور الجديدة للاقتصاد العالمي)
هذه المقالة 《All-In Podcast》حول تحول ساحة المعركة في الذكاء الاصطناعي إلى الاستنتاج، وإعادة تشغيل معركة الشرائح السيليكونية، وظهور شركات ناشئة جديدة، نشرت أولاً على 链新闻 ABMedia.