Laut Beating hat LangChain eine neue Deep-Agents-Komponente namens RubricMiddleware veröffentlicht, die es KI-Agenten ermöglicht, ihre eigenen Ausgaben automatisch anhand vorgegebener Standards zu überprüfen und zu verfeinern. Entwickler können Abnahmekriterien festlegen, etwa dass Code Tests besteht, Berichte die festgelegten Abschnitte abdecken oder Antworten keine verbotenen Inhalte enthalten. Das System startet dabei ein Prüfmodell, um jede Ausgabe gegen die Rubrik zu validieren; wenn die Standards nicht erfüllt sind, laufen Feedback-Schleifen an den Agenten zurück, bis er die Anforderungen erfüllt oder eine Iterationsgrenze erreicht.
Der Mechanismus adressiert eine gängige Herausforderung, bei der Agenten in komplexen Aufgaben häufig scheitern, wenn es um Formatvorgaben, Tests, Zitationen oder Abschnittsanforderungen geht. RubricMiddleware fungiert als automatisierter Qualitätscheck, der in die Aufgaben-Pipeline eingebettet ist, und hilft Agenten zu verstehen, was echte Vollständigkeit bedeutet, statt nur annähernde Antworten zu generieren. Der Ansatz eignet sich am besten für Aufgaben mit klaren Abnahmekriterien, etwa das Prüfen von Haiku-Silbenzahlen, das Bestätigen von Refactoring-Tests im Code oder das Sicherstellen der Vollständigkeit von Berichten.