بحسب Beating، أطلقت LangChain مكوّن Deep Agents جديدًا باسم RubricMiddleware يتيح لوكلاء الذكاء الاصطناعي مراجعة مخرجاتهم تلقائيًا وصقلها وفق معايير محددة مسبقًا. ويمكن للمطوّرين تحديد معايير الإكمال مثل اجتياز الاختبارات الخاصة بالكود، أو أن تغطي التقارير أقسامًا بعينها، أو أن تتجنب الردود المحتوى المحظور. يفعّل النظام نموذج مراجعة للتحقق من كل مخرج مقابل “روبرك” التقييم؛ وإذا لم تُستوفَ المعايير، تعود حلقات الملاحظات إلى الوكيل لإجراء تعديلات حتى ينجح أو يصل إلى حدود عدد التكرارات.

تتناول الآلية تحديًا شائعًا يتمثل في إخفاق الوكلاء في الالتزام بمتطلبات التنسيق أو الاختبار أو الاستشهاد أو الأقسام في المهام المعقدة. يعمل RubricMiddleware كفحص جودة آلي مدمج داخل مسار تنفيذ المهمة، مما يساعد الوكلاء على فهم معنى الإكمال الحقيقي بدلًا من توليد إجابات تقريبية. وتناسب هذه المقاربة أكثر المهام التي تمتلك معايير قبول واضحة، مثل التحقق من عدد مقاطع الهايكو، أو التأكد من اجتياز اختبارات إعادة هيكلة الكود، أو ضمان اكتمال التقارير.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

06-03 06:37

أعلنت Qwen إتاحة وصول كامل لوكلاء المهام التابعين لجهات خارجية وللمهارات؛ وانضمّت Luckin Coffee وKFC وMixue وشركة الخطوط الجوية الشرقية الصينية إلى برنامج Pilot اليوم

06-03 02:13

تعذر على تينسنت تأكيد جدول إطلاق وكيل الذكاء الاصطناعي في WeChat، مشيرة إلى مراجعة تنظيمية كعامل

06-02 11:09

أحدث الأبحاث: يطوّر نموذج 9B قدرات تحديثٍ ذاتي لمضاهاة أداء Claude Opus 4.6

06-02 06:17

اختبرت شركة Tencent وكلاء الذكاء الاصطناعي في تطبيق WeChat في يونيو، وأتاحت مهاماً عبر التطبيقات المصغّرة

06-02 00:57

أطلقت شركة Alibaba نموذج وكيل ذكاء اصطناعي متعدد الوسائط Qwen3.7-Plus مع إتاحة وصول عبر واجهة برمجة تطبيقات تجارية

تحليل متعمق