据 Beating 称,LangChain 发布了一个名为 RubricMiddleware 的新 Deep Agents 组件,使 AI 代理能够根据预设标准自动审查并完善其自身输出。开发者可以定义完成标准,例如代码通过测试、报告覆盖指定章节,或回复避免违规内容。该系统会触发一个审查模型,用 rubric(评分准则)来验证每次输出是否符合标准;如果未达标,反馈会回传给代理进行修订,直到通过或达到迭代上限。
该机制解决了一个常见难题:在复杂任务中,代理往往无法满足格式、测试、引用或分章节要求。RubricMiddleware 作为嵌入任务流水线的自动化质量检查,帮助代理理解真正的完成情况,而不是生成近似答案。这种方法最适用于具有明确验收标准的任务,例如核验俳句音节数、确认代码重构测试,或确保报告完整性。