أطلقت LangChain RubricMiddleware لإجراء فحوصات جودة مستقلة لوكلاء الذكاء الاصطناعي

بحسب Beating، أطلقت LangChain مكوّن Deep Agents جديدًا باسم RubricMiddleware يتيح لوكلاء الذكاء الاصطناعي مراجعة مخرجاتهم تلقائيًا وصقلها وفق معايير محددة مسبقًا. ويمكن للمطوّرين تحديد معايير الإكمال مثل اجتياز الاختبارات الخاصة بالكود، أو أن تغطي التقارير أقسامًا بعينها، أو أن تتجنب الردود المحتوى المحظور. يفعّل النظام نموذج مراجعة للتحقق من كل مخرج مقابل “روبرك” التقييم؛ وإذا لم تُستوفَ المعايير، تعود حلقات الملاحظات إلى الوكيل لإجراء تعديلات حتى ينجح أو يصل إلى حدود عدد التكرارات.

تتناول الآلية تحديًا شائعًا يتمثل في إخفاق الوكلاء في الالتزام بمتطلبات التنسيق أو الاختبار أو الاستشهاد أو الأقسام في المهام المعقدة. يعمل RubricMiddleware كفحص جودة آلي مدمج داخل مسار تنفيذ المهمة، مما يساعد الوكلاء على فهم معنى الإكمال الحقيقي بدلًا من توليد إجابات تقريبية. وتناسب هذه المقاربة أكثر المهام التي تمتلك معايير قبول واضحة، مثل التحقق من عدد مقاطع الهايكو، أو التأكد من اجتياز اختبارات إعادة هيكلة الكود، أو ضمان اكتمال التقارير.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات