أطلقت شركة مايكروسوفت Critique، نظام بحث عميق متعدد النماذج جديد في M365 Copilot

باختصار

قدّمت مايكروسوفت Critique، وهو نظام جديد للأبحاث العميقة متعدد النماذج داخل Researcher، وكيل الأبحاث العميقة في Microsoft 365 Copilot، وذلك ضمن دفعة أوسع لجعل Copilot يبدو أكثر موثوقية لأعمال المعرفة الجادة بدلًا من كونه مجرد كتابة سريعة.

Microsoft Introduced Critique, A New Multi-Model Deep Research System In M365 Copilotقدّمت مايكروسوفت Critique، وهو نظام جديد للأبحاث العميقة متعدد النماذج داخل Researcher، وكيل الأبحاث العميقة في Microsoft 365 Copilot، وذلك ضمن دفعة أوسع لجعل Copilot يبدو أكثر موثوقية لأعمال المعرفة الجادة بدلًا من كونه مجرد كتابة سريعة

وفقًا لمايكروسوفت، صُمّم Critique للمهام البحثية المعقدة، ويعمل عبر تقسيم العمل إلى جزأين: نموذج واحد يتولى التخطيط والاسترجاع وصياغة المحتوى، بينما نموذج ثانٍ يراجع المخرجات ويُحسّنها قبل إنتاج التقرير النهائي. تقول مايكروسوفت إن النظام يستخدم نماذج من مختبرات الصفّ الأول تشمل OpenAI وAnthropic، وأنه متاح الآن عبر برنامج Frontier التابع للشركة

ذكرت Reuters أنه في الإعداد الحالي لـ Critique، يقوم GPT الخاص بـ OpenAI بتوليد الاستجابة، بينما يراجع Claude من Anthropic ذلك من حيث الدقة والجودة قبل أن تصل الإجابة إلى المستخدم. كما قالت مايكروسوفت إنها تريد لاحقًا أن يصبح هذا سير العمل ثنائي الاتجاه، بما يسمح للنماذج بمراجعة بعضها بعضًا في الاتجاهين

ماذا يفعل Critique فعليًا داخل Microsoft 365 Copilot

يوضح وصف مايكروسوفت لـ Critique بجلاء أنه ليس مجرد ميزة شكلية أو زرًّا جديدًا تم لصقه على Copilot.It يعمل داخل Researcher في Microsoft 365 Copilot، وهو مُصمّم لمهام أعمق حيث يَهمّ أن تحصل على النتيجة الصحيحة بقدر ما يَهمّ إنجازها بسرعة. يقوم نموذج واحد بالحفر وصياغة التقرير، بينما يدخل النموذج الثاني كما لو كان محررًا، فيتحقق من الحقائق ويُحسّن البنية ويساعد على تحويلها إلى جزء نهائي أكثر موثوقية

تقول مايكروسوفت إن الفكرة الكاملة تتمثل في فصل التوليد عن التقييم، بدلًا من مطالبة نموذج واحد بأن يتولى العصف الذهني والكتابة والتحقق من الحقائق وصقل عمله بنفسه في آنٍ واحد. تبرز أهمية هذا الفرق لأن جزءًا كبيرًا من حالات فشل الذكاء الاصطناعي يأتي من اختناق نقطة واحدة لنموذج واحد. عندما يُطلب من نظام واحد أن يفعل كل شيء، قد ينتج شيئًا يبدو مصقولًا بينما يفوته بهدوء وجود فجوات، أو يبالغ في الادعاءات، أو يستند إلى أدلة ضعيفة

تقول مايكروسوفت إن طبقة المراجعة في Critique مبنية على تقييم قائم على Rubric، مع التركيز على موثوقية المصادر واكتمال التقرير وتثبيت الأدلة بشكل صارم. وبعبارات بسيطة، يتواجد النموذج الثاني ليطرح السؤال: هل أجاب المسوّد بالفعل عن السؤال؟ وهل المصادر متينة؟ وهل يدعم السرد النهائي بدلًا من أن يكتفي بأن يبدو واثقًا

مايكروسوفت لا تروّج لـ Critique كتجربة جانبية

من التفاصيل الأهم في إعلان مايكروسوفت أن Critique سيكون التجربة الافتراضية في Researcher عندما يتم اختيار Auto في منتقي النماذج. يشير ذلك إلى أن الشركة ترى في ذلك أكثر من مجرد ميزة مخبرية اختيارية لمستخدمي الصلاحيات. إنها عمليًا تعامل مراجعة متعدد النماذج باعتبارها خط الأساس الجديد لجودة الأبحاث العميقة داخل Microsoft 365 Copilot. هذا اختيار منتج ذا معنى، لأنه يوحي بأن مايكروسوفت تعتقد أن العملاء من الشركات يهتمون بدرجة أقل بسرعة الاستجابة الخام، وبدرجة أكبر بعدد أقل من الهلاوس، وبنية أقوى، وثقة أعلى في التقرير النهائي

ويتوافق ذلك أيضًا بشكل منطقي مع الرسائل الأوسع التي تروج لها مايكروسوفت حول Wave 3 من Microsoft 365 Copilot، حيث كانت الشركة تدفع بفكرة Copilot بوصفه “نظامًا للعمل” مبنيًا على ميزة متعددة النماذج بدلًا من الاعتماد على أي مختبر ذكاء اصطناعي واحد. في صياغة مايكروسوفت، من المفترض أن يسحب Copilot أفضل ذكاء متاح من مختلف أنحاء الصناعة، مع مراعاة سياق العمل عبر ما تسميه Work IQ، ومحمى عبر ضوابط بيانات المؤسسات. يُعد Critique أحد أوضح الأمثلة حتى الآن على انتقال هذه الاستراتيجية من لغة التسويق إلى ميزة منتج قابلة للمشاهدة

أرقام الاختبار المرجعي جزء كبير من خطاب المبيعات لدى مايكروسوفت

مايكروسوفت لا تقول فقط إن Critique يبدو أفضل. بل تقول أيضًا إن النظام حقق أداءً أفضل على اختبار مرجعي رسمي. وفي عرضه التقني، تقول الشركة إنها اختبرت Critique على معيار DRACO، اختصار Deep Research Accuracy, Completeness, and Objectivity، والذي يغطي 100 مهمة بحث معقدة عبر 10 مجالات. وتقول مايكروسوفت إن الاستجابات جرى تقييمها عبر الدقة الواقعية، واتساع وعمق التحليل، وجودة العرض، وجودة الاستشهادات، وأن Critique تفوّق على نسخة Researcher ذات النموذج الواحد عبر المقاييس الأربعة جميعها

سلطت الشركة الضوء على أكبر المكاسب في اتساع وعمق التحليل، تليها جودة العرض ثم الدقة الواقعية. كما تقول إن التحسينات كانت ذات دلالة إحصائية، وأن Researcher مع Critique قدّم تحسنًا إجماليًا بمقدار +7.0 نقاط، أي +13.88% مقارنة بـ Perplexity Deep Research (نموذج Claude Opus 4.6)، الذي وصفت مايكروسوفت بأنه أفضل نظام ذُكر في ورقة الاختبار المرجعي

Data | المصدر: Microsoft

هذه مطالبة لافتة للنظر، خصوصًا لأن سباق الأبحاث العميقة أصبح أحد أكثر الجبهات تنافسية في مجال الذكاء الاصطناعي داخل الشركات. لم تعد أدوات البحث تُقاس فقط بقدرتها على جمع المعلومات، بل بما إذا كانت قادرة على تجميع تقرير يبدو جاهزًا لاتخاذ القرار

تتمثل حجة مايكروسوفت في أن طبقة المراجعة تُجبر الباحثين على تحديد الزوايا الناقصة، وتشديد تنظيم المحتوى، ومساءلة الادعاءات الضعيفة، واستخدام الاستشهادات بدقة أكبر. وسواء شعر العملاء بهذه المكاسب في سير العمل الفعلي أم لا، فالأهم سيكون ذلك أكثر من الرسوم البيانية للاختبارات، لكن مايكروسوفت تحاول بوضوح الإشارة إلى حدوث قفزة جودة قابلة للقياس بدلًا من مجرد تحديث غامض للنموذج

يظهر Council أن مايكروسوفت تفكر بما هو أبعد من “أفضل إجابة” واحدة

Critique ليست الميزة الوحيدة التي قدمتها مايكروسوفت إلى جانب هذا التحديث. فقد أطلقت الشركة أيضًا Council، وهو وضع مقارنة متعدد النماذج داخل Researcher. تقول مايكروسوفت إن Council يشغّل نماذج Anthropic وOpenAI في الوقت نفسه، مما يسمح لكل نموذج بتوليد تقرير كامل قائم بذاته. ثم يقوم نموذج حكم منفصل بإنتاج ملخص مُختصر يوضح أين تتوافق التقارير، وأين تتباين، وما الذي يقدمه كل تقرير بشكل فريد. تصف Microsoft Support ذلك بأنه Model Council، وهو وضع يحافظ على كلا التقريرين الكاملين ويضيف ملخصًا للمقارنة لمساعدة المستخدمين على تحديد أي ناتج أقوى أو كيفية دمجهما

هذه إشارة مثيرة جدًا للاهتمام حول الاتجاه الذي قد تسلكه الذكاءات الاصطناعية المؤسسية. لفترة، تصرّف قطاع الصناعة كما لو أن الهدف هو العثور على نموذج واحد يمكنه استبدال كل النماذج الأخرى. يشير تحرك مايكروسوفت الأخير إلى أن المستقبل الأكثر واقعية قد يكون واحدًا لا تعوّل فيه الشركات على أي نموذج واحد بدرجة كافية كي تجعله الصوت الوحيد في الغرفة

توقيت Critique ليس صدفة. فقد تعرضت مايكروسوفت لضغط لإثبات أن Microsoft 365 Copilot تصبح أكثر فائدة وأكثر تميزًا وأكثر قيمة مع اشتداد حدة المنافسة

ربطت Reuters طرح Critique وCouncil بمحاولة مايكروسوفت لتحسين تبنّي Copilot في سوق يدفع فيه المنافسون، بما في ذلك منتجات Gemini من Google وClaude من Anthropic، بقوة نحو الذكاء الاصطناعي في مكان العمل. كما أشارت Axios أيضًا إلى أن استراتيجية مايكروسوفت متعددة النماذج تمتلك فائدة إضافية: فهي تُظهر أن الشركة ليست محصورة في الاعتماد المفرط على OpenAI في وقت يمكن أن يتغير فيه ريادة نماذج الصف الأول بسرعة

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.24Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.44Kعدد الحائزين:2
    1.23%
  • القيمة السوقية:$2.25Kعدد الحائزين:1
    0.00%
  • تثبيت