自主智能AI正在金融领域引发关注,但行业面临的最大障碍不再是模型是否足够强大。更难的问题在于:银行、资产管理公司以及资金调度(treasury desks)是否具备基础设施,能够在不丢失对资金、责任或合规的控制的情况下,把金融任务委托给自治系统。德勤(Deloitte)对超过3,300名金融与会计专业人士的调查清楚地表明了这种差距:80.5%的人表示,像代理(agents)和生成式AI(GenAI)聊天机器人这样的AI驱动工具可能会在未来五年内成为标准,但只有13.5%的人表示,他们的组织已经在使用自治智能AI。花旗(Citi)Sky展示了为何基础设施层面的讨论至关重要花旗于4月22日推出了Citi Sky——一款由Google Cloud和Google DeepMind技术打造的AI驱动财富助手。该工具使用Google的Gemini Enterprise Agent Platform开发,并计划在今年夏天对美国的Citigold客户进行分阶段推出。该发布让“自治智能AI”的讨论有了一个现场银行案例。花旗财富科技负责人Dipendra Malhotra指出,记忆(memory)是高风险咨询型AI的核心限制,并追问:客户能把一段对话持续多久,直到系统开始产生幻觉(hallucinating)。大多数代理依赖检索增强生成(retrieval-augmented generation),通过外部数据库来扩展记忆。但上下文窗口(context windows)仍会限制代理一次最多能容纳多少信息。在金融建议、资金管理或投资组合执行中,这个“记忆上限”就不再只是技术问题,而会演变为一种运营风险(operational risk)。CoinFello联合创始人MihnChi Park表示,可信委托的条件很简单:代理只能在用户指令范围内行动,用户可以随时停止它,而且底层资产绝不会转移给第三方。以太坊为代理身份提出链上基础原语(on-chain primitives)以太坊提案ERC-8004提出了代理身份、声誉和验证的系统。该草案标准规定了三个注册表(registries):Identity Registry、Reputation Registry和Validation Registry。合起来,它们旨在帮助自治代理证明自己是谁、建立行为记录,并支持其他市场参与者进行验证。ERC-8183则采取了更聚焦的路径。它提出一种带有评估者(evaluator)出具证明(attestation)的工作托管(job escrow)标准:客户为一项工作提供资金,服务提供方提交工作,评估者完成或拒绝该结果。该提案不提供仲裁或正式的争议解决,但它为基于代理的市场提供了一个用于托管任务与可验证完成的框架。题为《The Agent Economy: A Blockchain-Based Foundation for Autonomous AI Agents》的arXiv论文为这一转变绘制了五层架构,涵盖物理基础设施、链上身份、认知工具(cognitive tooling)、经济结算(economic settlement)以及集体治理(collective governance)。声誉层(reputation layer)仍存在结构性脆弱性。代理生成活动的速度与规模可以远超人类,从而使得在短时间内“抬高”信任信号成为可能。这就把金融机构带入一个棘手的问题:当一个代理有良好记录时,这份记录证明的是可靠性,还是仅仅证明了重复的自动化活动?麦肯锡将50%到60%的银行运营纳入其口径范围麦肯锡估计,银行中与运营相关的全职等价(full-time equivalents)在50%到60%之间。专家警告存在“试点地狱(pilot purgatory)”,即机构在不改造运营模型的情况下,仅运行狭窄的概念验证(proofs of concept)。正如Cryptopolitan从香港Web3 Festival报道的那样,麦肯锡预测自治智能AI市场将从2024年的$5.25 billion增长到2034年前后约$200 billion。W3.io首席执行官Porter Stowell表示:“企业无法查看、控制或审计自治系统正在用他们的钱做什么。人类监督不会消失,只是上移到了更高的层级。”仍有四个问题未能解决:当AI代理造成金融损失时谁负责、其声誉是否可信、当这些系统规模化部署后谁在控制,以及当代理在其适用范围之外行动时应适用怎样的监管框架。还能让银行保留最好的部分?观看我们关于如何做你自己的银行(being your own bank)的免费视频。
AI 代理仍处于试点模式,因为银行仍然不信任它们
自主智能AI正在金融领域引发关注,但行业面临的最大障碍不再是模型是否足够强大。更难的问题在于:银行、资产管理公司以及资金调度(treasury desks)是否具备基础设施,能够在不丢失对资金、责任或合规的控制的情况下,把金融任务委托给自治系统。
德勤(Deloitte)对超过3,300名金融与会计专业人士的调查清楚地表明了这种差距:80.5%的人表示,像代理(agents)和生成式AI(GenAI)聊天机器人这样的AI驱动工具可能会在未来五年内成为标准,但只有13.5%的人表示,他们的组织已经在使用自治智能AI。
花旗(Citi)Sky展示了为何基础设施层面的讨论至关重要
花旗于4月22日推出了Citi Sky——一款由Google Cloud和Google DeepMind技术打造的AI驱动财富助手。该工具使用Google的Gemini Enterprise Agent Platform开发,并计划在今年夏天对美国的Citigold客户进行分阶段推出。
该发布让“自治智能AI”的讨论有了一个现场银行案例。花旗财富科技负责人Dipendra Malhotra指出,记忆(memory)是高风险咨询型AI的核心限制,并追问:客户能把一段对话持续多久,直到系统开始产生幻觉(hallucinating)。
大多数代理依赖检索增强生成(retrieval-augmented generation),通过外部数据库来扩展记忆。但上下文窗口(context windows)仍会限制代理一次最多能容纳多少信息。
在金融建议、资金管理或投资组合执行中,这个“记忆上限”就不再只是技术问题,而会演变为一种运营风险(operational risk)。
CoinFello联合创始人MihnChi Park表示,可信委托的条件很简单:代理只能在用户指令范围内行动,用户可以随时停止它,而且底层资产绝不会转移给第三方。
以太坊为代理身份提出链上基础原语(on-chain primitives)
以太坊提案ERC-8004提出了代理身份、声誉和验证的系统。该草案标准规定了三个注册表(registries):Identity Registry、Reputation Registry和Validation Registry。
合起来,它们旨在帮助自治代理证明自己是谁、建立行为记录,并支持其他市场参与者进行验证。
ERC-8183则采取了更聚焦的路径。它提出一种带有评估者(evaluator)出具证明(attestation)的工作托管(job escrow)标准:客户为一项工作提供资金,服务提供方提交工作,评估者完成或拒绝该结果。
该提案不提供仲裁或正式的争议解决,但它为基于代理的市场提供了一个用于托管任务与可验证完成的框架。
题为《The Agent Economy: A Blockchain-Based Foundation for Autonomous AI Agents》的arXiv论文为这一转变绘制了五层架构,涵盖物理基础设施、链上身份、认知工具(cognitive tooling)、经济结算(economic settlement)以及集体治理(collective governance)。
声誉层(reputation layer)仍存在结构性脆弱性。代理生成活动的速度与规模可以远超人类,从而使得在短时间内“抬高”信任信号成为可能。
这就把金融机构带入一个棘手的问题:当一个代理有良好记录时,这份记录证明的是可靠性,还是仅仅证明了重复的自动化活动?
麦肯锡将50%到60%的银行运营纳入其口径范围
麦肯锡估计,银行中与运营相关的全职等价(full-time equivalents)在50%到60%之间。专家警告存在“试点地狱(pilot purgatory)”,即机构在不改造运营模型的情况下,仅运行狭窄的概念验证(proofs of concept)。
正如Cryptopolitan从香港Web3 Festival报道的那样,麦肯锡预测自治智能AI市场将从2024年的$5.25 billion增长到2034年前后约$200 billion。
W3.io首席执行官Porter Stowell表示:“企业无法查看、控制或审计自治系统正在用他们的钱做什么。人类监督不会消失,只是上移到了更高的层级。”
仍有四个问题未能解决:当AI代理造成金融损失时谁负责、其声誉是否可信、当这些系统规模化部署后谁在控制,以及当代理在其适用范围之外行动时应适用怎样的监管框架。
还能让银行保留最好的部分?观看我们关于如何做你自己的银行(being your own bank)的免费视频。