美团LongCatがVitaBench 2.0を長期ユーザーモデリング向けにオープンソース化

Jin10によると、Meituan LongCatは本日、長期的かつ現実世界の動的なユーザーインタラクションシナリオにおける大規模言語モデルエージェントを評価する初のベンチマーク「VitaBench 2.0」をオープンソース化しました。このベンチマークは、持続的なユーザーエンゲージメントにおけるLLMのパーソナライゼーションとプロアクティブな能力を体系的に評価します。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし