ترقية كبيرة لـ Google Gemini 3 Deep Think: قدرة الاستنتاج تتفوق على Opus 4.6 و GPT-5.2، بهدف أن يكون "أكثر ذكاء اصطناعي يبحث عن العلم"

BTC2.34%

أصدرت جوجل تحديثا كبيرا لبرنامج Gemini 3 Deep Think، متجاوزة بشكل كبير كلود أوبوس 4.6 (68.8٪) وGPT-5.2 (52.9٪) في اختبار ARC-AGI-2 بنسبة 84.6٪، مع تحقيق تصنيف “السيد الكبير الأسطوري” في Codeforces.
(الملخص: تم تقديم نموذج التعلم في ChatGPT: هل هو غروب الدروس الخصوصية، أم فجر العصر الذهبي للتعليم؟ )
(ملحق خلفي: أطلقت جوجل رسميا “جيميني 3”!) ما هي أبرز إنجازات الوصول إلى قمة أذكى نموذج ذكاء اصطناعي في العالم؟ )

جدول محتويات هذا المقال

  • ليس فقط الامتحانات، بل أيضا اكتشاف الأخطاء البشرية
  • التغيرات القشرية في حصة السوق
  • تأثير تموجي على صناعة العملات الرقمية
  • العلم بدأ للتو

أصدرت جوجل اليوم (الثالث عشر) ترقية كبيرة لجيميني 3 ديب ثينك. في اختبار ARC-AGI-2 (وهو اختبار استدلالي مخصص لمنع الذكاء الاصطناعي من حفظ بنوك الأسئلة، ولا يختبر مدى معرفتك، وما إذا كان بإمكانك تلخيص القواعد بنفسك من عدة أمثلة)، حصل اختبار Gemini 3 Deep Think على نسبة 84.6٪.

للمعلومية، حصل Claude Opus 4.6 (وضع التفكير الأكسي) على 68.8٪، وGPT-5.2 (وضع التفكير xhigh) على 52.9٪، ومتوسط الدرجة البشرية حوالي 60٪.

وما هو أكثر إثارة للدهشة هو أنه في اختبار ARC-AGI-1 الأصلي، حصلت Deep Think على 96٪، مما دفع هذا المعيار، الذي كان يعتبر سابقا “أحد أصعب الاختبارات في الذكاء الاصطناعي”، إلى أقصى حد.

Deep Think متاح حاليا لمشتركي Google AI Ultra، وواجهة برمجة التطبيقات مفتوحة للمؤسسات في مرحلة الوصول المبكر.

ليس فقط الامتحانات، بل أيضا أخطاء بشرية

بالإضافة إلى النتائج المستمرة، ذكرت جوجل تفصيلا في الإعلان: نجح Deep Think في تحديد ثغرة منطقية لم يكتشفها أي من المراجعين سابقا عند مراجعة ورقة رياضية تمت مراجعتها من قبل البشر. تم تأكيد هذه الورقة من قبل علماء الرياضيات في جامعة روتجرز.

تكمن أهمية هذه الحالة ليس في أداء النموذج في الاختبارات الموحدة، بل في قدرته على إثبات النتائج في سيناريوهات علمية حقيقية ومفتوحة النهاية. المراجعة من الأقران هي آلية التحكم الأساسية في الجودة في الأوساط الأكاديمية، وإذا تمكن الذكاء الاصطناعي من تقديم مساعدة قيمة باستمرار في هذه العملية، فإن تأثيره التسريع على البحث العلمي سيكون أبعد بكثير مما يمكن قياسه بأي معيار.

كما حقق ديب ثينك مستوى الميدالية الذهبية في قسم الاختبار التحريري من أولمبياد الفيزياء والكيمياء الدولي لعام 2025، بدرجة إيلو 3,455 في كودفورس، وهو ما يعادل مستوى “المعلم الكبير الأسطوري”، وهو عدد قليل فقط من المبرمجين البشر في العالم يمكنهم الوصول إلى هذا المستوى.

في “الامتحان الأخير للبشرية”، وهو معيار صممه خبراء في مجالات مختلفة وجعل الذكاء الاصطناعي متعمدا صعبا على الإجابة، حصل Deep Think على 48.4٪ (دون استخدام الأدوات)، محققا رقما قياسيا جديدا أيضا.

التغيرات القشرية في حصة السوق

السباق التقني في الثلاثي الكبار للذكاء الاصطناعي يغير مشهد السوق. انخفضت حصة ChatGPT السوقية من 87٪ في ذروتها إلى حوالي 68٪، بينما ارتفعت Gemini من أقل من 5٪ إلى أكثر من 18٪، وقامت شركة Anthropic بتآكل سوق المؤسسات بشكل مستمر.

الميزة الفريدة لجوجل في هذا السباق هي قدرتها على التوزيع. جيميني مدمج في أندرويد، ومتصفح كروم، وجوجل وورك بيس، ومحركات البحث، مما يعني أنه حتى لو كان متساويا مع منافسيه من حيث قدرات النماذج، يمكن لجوجل كسب المستخدمين من خلال مزايا القنوات.

لكن ميزة التوزيع هي سيف ذو حدين. إذا لم تكن تجربة Gemini جيدة بما فيه الكفاية، فقد تفقد ثقة المستخدمين أسرع من أي منافس لأن المستخدمين “يتفاعلون بشكل سلبي” بدلا من “اختيار نشط”. مستخدمو OpenAI يدفعون بنشاط ولديهم تحمل وثبات أعلى بطبيعتهم.

تأثير متتابع على صناعة العملات الرقمية

كل ترقية في سباق الذكاء الاصطناعي تدفع الطلب على البنية التحتية للحوسبة. تكلفة عناقيد وحدات معالجة الرسوميات المطلوبة لتدريب نموذج متقدم ارتفعت بشكل كبير من مئات الملايين من الدولارات في عام 2024 إلى مليارات الدولارات في عام 2026. وهذا يؤثر أيضا بشكل مباشر على أمرين.

**أولا، مسار التحول لمعدني البيتكوين.**عندما يتم ضغط أرباح التعدين (تقدر شركة JPMorgan Chase & Co. أن تكاليف إنتاج البيتكوين انخفضت إلى 7.7 مليون دولار هذا الأسبوع، بينما يبلغ سعر العملة حوالي 6.6 مليون)، فإن عمال المناجم الذين يمتلكون بنية تحتية حوسبة واسعة النطاق يسرعون تحولهم نحو خدمات الحوسبة بالذكاء الاصطناعي.

شركات التعدين عالية التكلفة لا “تخرج” بل “تغير مسارها المهني”، من تعدين البيتكوين إلى دخل العقود الذي يوفر قوة حوسبة بالذكاء الاصطناعي.

**ثانيا، سرد رموز الذكاء الاصطناعي.**كلما أصدرت جوجل أو OpenAI أو Anthropic ترقية كبيرة، عادة ما تتعرض الرموز المرتبطة بالذكاء الاصطناعي ضمن السلسلة مثل بروتوكولات الحوسبة اللامركزية لضجة قصيرة الأمد.

لكن المشكلة الأساسية لهذه الرموز لم تتغير: الحوسبة اللامركزية لا تزال بعيدة جدا عن الطلب على تدريب الذكاء الاصطناعي على مستوى المؤسسات من حيث التأخير وسرعة النقل. يمكن أن تسير السردية بسرعة، لكن البنية التحتية لا تستطيع مواكبة سرعة السرد.

فاصل التعادل العلمي بدأ للتو

الترقية إلى التفكير العميق تدفع جوجل إلى الصدارة في سباق الذكاء الاصطناعي، على الأقل في مجالي التفكير والعلم. لكن إذا نظرت عن كثب إلى صياغة إعلان جوجل، ستلاحظ تحولا طفيفا في التمركز: فبدلا من التركيز على “أذكى ذكاء اصطناعي عام الاستخدام”، يكرر المنشور “مصمم للعلم”.

مع ازدحام معايير الذكاء الاصطناعي العامة وصعوبة التمييز، فإن عبارة “ذكائي الاصطناعي يمكنه مساعدتك في إجراء أبحاث علمية” هي عرض قيمة أكثر إقناعا من “ذكائي الاصطناعي لديه أعلى درجة في التمرير.” إذا كان التفكير العميق قادرا حقا على المساعدة بشكل موثوق في مراجعة الأقران، وتسريع اكتشاف الأدوية، أو إيجاد حلول يغفلها البشر في محاكاة الفيزياء، فسيكون ذلك أكثر منطقية من أي قائمة مرجعية.

المشكلة أن المسافة بين “يمكن الحصول على درجات عالية في المعايير” إلى “يمكنها مساعدة البشر بشكل موثوق في السيناريوهات العلمية الحقيقية” قد تكون أبعد مما تقترحه جوجل، فبعد كل شيء، المعايير لها إجابات قياسية، أما العلم فلا يملكها.

شاهد النسخة الأصلية
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

أداء صندوق ETF لـ XRP يُمدح بأنه 'مثير للإعجاب حقًا' من قبل بلومبرج - ي.يومن

صناديق ETF لـ XRP أظهرت مرونة وسط انخفاض السعر بنسبة 45%، مما جذب رأس مال كبير على الرغم من السلوك السوقي النموذجي. يسلط إريك بالتشوناس من بلومبرغ الضوء على دعم المستثمرين القوي. على الرغم من التدفقات الخارجة الأخيرة، لا تزال الصناديق تحتفظ بأصول كبيرة، مما يدل على تفاني المجتمع.

UTodayمنذ 12 د

تتألق العملات الرقمية وسط صدمة النفط في الشرق الأوسط وبيع السوق

يظل البيتكوين مستقرًا وسط اضطرابات السوق التي تغذيها ارتفاع أسعار النفط والتضخم، متفوقًا على الأصول التقليدية. يقلل تقليل الرافعة المالية من عمليات البيع القسري، مما يجذب المستثمرين على المدى الطويل الذين يراقبون الأرباح المحتملة في بيئة متقلبة.

CryptoFrontNewsمنذ 18 د

تشانغ فونغ، المدير التنفيذي، يختبر تحويل العملات المستقرة، لكن تم سوء فهم تكلفة البلوكشين

شركة تشو فونغ المالية تعقد مؤتمرًا إعلاميًا في العاشر من الشهر، وكشف رئيس مجلس إدارتها، دونغ رويبين، أنه من أجل مقارنة كفاءة التحويلات البنكية وتقنية البلوك تشين بشكل موضوعي، قامت بنك تشو فونغ العام الماضي بتفعيل اختبار في 17 دولة حول العالم و25 فرعًا خارجيًا. قام موظفو الفروع بفتح حسابات في بورصات قانونية محلية، وتداولوا عبر منصة الأصول الافتراضية BitoPro، حيث حولوا 50 USDT من عملة الاستقرار الرقمية الدولار الأمريكي إلى تايوان، وقارنوا ذلك مع التحويلات البنكية التقليدية عبر الحدود. وأظهرت النتائج أن العملة المستقرة توفر ميزة في التحويلات الصغيرة عبر الحدود، ولكن إذا تجاوز مبلغ التحويل ما يعادل 200,000 نات (حوالي 7,000 دولار أمريكي)، فإن البنوك تظل أكثر كفاءة من حيث التكلفة. تجربة تشو فونغ: التحويلات البنكية أكثر توفيرًا فوق 7,000 دولار وأظهرت نتائج الاختبار أنه في سيناريو "دفع نات في تايوان واستلام العملة المحلية في الوجهة"، عادةً ما تصل الحوالة البنكية خلال حوالي ساعتين، وتبلغ رسوم المعاملة حوالي

ChainNewsAbmediaمنذ 40 د

تذكير بانخفاض TradFi: انخفاض مؤشر VIX بأكثر من 6%

بوت أخبار Gate، وفقًا لبيانات Gate TradFi الأخيرة، انخفض مؤشر VIX مؤقتًا بنسبة 6%، ويُظهر نطاق التقلب الحالي ارتفاعًا واضحًا عن المتوسطات الأخيرة، وزادت نشاطات السوق.

GateNewsمنذ 2 س

مدير Ripple يحدد تركيا ونيجيريا والإمارات العربية المتحدة كأسواق "يجب مراقبتها" - U.Today

أوضح ريس ميريك من ريبل خطط العملة المستقرة RLUSD، مستهدفًا تركيا ونيجيريا والإمارات العربية المتحدة لتعزيز التوسع العالمي. تظهر هذه الدول طلبًا كبيرًا على الدولار الرقمي، وهو أمر حاسم للعمليات المالية، مع توقعات بحدود $33 تريليون في معاملات العملات المستقرة بحلول عام 2025.

UTodayمنذ 3 س

أمازون تخطط لعقد اجتماع داخلي لمواجهة مشكلة انقطاع خدمات التشفير المساعد بالذكاء الاصطناعي

أمازون ستعقد في 12 مارس مؤتمرًا باسم TWiST لمناقشة انقطاع الخدمة الأخير الناتج عن أخطاء في ترميز الذكاء الاصطناعي، ويترأس الاجتماع المدير التنفيذي ديف تريدويل، مع التركيز على الأعطال المتكررة في النظام.

GateNewsمنذ 3 س
تعليق
0/400
لا توجد تعليقات