自 ChatGPT 爆发以来,市场对 AI 的理解长期集中在“认知能力”层面,包括文本生成、代码编写与逻辑推理。这一阶段的核心,是让机器更好地理解并生成信息,本质仍属于数字世界内部的优化。然而,Andreessen Horowitz 在其研究中提出,AI 正在进入一个全新阶段:从“理解世界”转向“作用于世界”。
这一变化可以用一个清晰的三段式来理解:
过去:AI 提供信息(回答问题)
现在:AI 协助决策(Agent)
未来:AI 直接执行(Physical AI)
也就是说,AI 的终极目标不再是“更聪明”,而是“更有用”,即能够在现实世界中完成任务并产生结果。

在 Physical AI 框架中,a16z 将其拆解为三个核心系统,这三者共同构成一个闭环数据飞轮,而不是孤立存在。
机器人系统,它是 AI 进入物理世界的执行载体。机器人不再只是机械设备,而是融合感知、决策与控制能力的综合系统。以 Tesla 为例,其推动的人形机器人项目,本质目标并不是硬件创新,而是打造可以在复杂环境中稳定执行任务的 AI 系统。
自主科学系统,即自动化实验平台。其意义在于让 AI 从“提出假设”延伸到“验证假设”。这一过程可以拆解为:
AI 生成研究假设
系统自动设计实验流程
实验设备执行并采集数据
AI 分析结果并迭代优化
这一闭环使得知识生产逐步自动化,同时产生大量高质量、具备因果关系的数据。
记录人类操作行为(第一视角)
捕捉生理与动作反馈
提取潜在意图信号
这使得 AI 能够获得更真实、更连续的数据输入。
当前 AI 的发展正在遭遇一个隐性瓶颈:互联网数据红利逐渐耗尽。文本与代码数据虽然规模庞大,但其边际价值正在下降。在这一背景下,Physical AI 引入了新的数据来源,即来自真实世界的交互数据。
可以将两种数据范式对比理解:
特征:规模大、易获取
局限:以相关性为主、噪声高
特征:稀缺、获取成本高
优势:具备因果关系、可验证
这一转变将直接推动 AI 能力的升级路径发生变化:
从“预测系统”转向“控制系统”
从“生成答案”转向“优化结果”
从“离线训练”转向“实时反馈”
从技术实现角度来看,Physical AI 的竞争核心并不在应用层,而在基础设施层。其关键组成可以归纳为四个部分:
仿真系统(Simulation): 作为数据生成引擎,仿真系统可以在虚拟环境中训练 AI,大幅降低现实试错成本。以 NVIDIA 的 Omniverse 为代表,这类平台正在成为连接数字与物理世界的重要桥梁。
世界模型(World Models): 用于理解物理环境的运行规律,包括物体运动、环境变化等,是 AI 做出正确决策的前提。
行动模型(Action Models): 将决策转化为具体操作,是 AI 从“思考”走向“执行”的关键。
新型传感器(Sensors): 提供多维度输入,包括视觉、触觉与生物信号,使 AI 能够更全面地感知世界。
随着技术路径变化,价值分布也在重新调整。过去集中在应用层的价值正在被压缩,而系统层与基础设施层的重要性不断上升。
这一变化可以总结为三点:
应用层趋于同质化:进入门槛低,竞争激烈
系统层价值提升:机器人与自动化系统成为核心载体
数据成为壁垒:真实世界数据难以复制,具备长期价值
特别是在数据层面,Physical AI 带来的最大变化在于:数据不再是“可无限复制的资源”,而变成“需要长期积累的资产”。
从投资视角来看,这一阶段呈现出明显不同的结构特征。
首先是资本密集度提升,Physical AI 更接近以下产业形态:
半导体
新能源
航空航天
这意味着:
投入更高
回报周期更长
技术壁垒更强
其次,产业链可以拆解为三个层级:
上游:算力与仿真平台
中游:模型与系统整合
下游:应用与场景落地
最后,在发展节奏上,可以用一个三阶段模型来理解:
短期:Agent 在数字世界扩展
中期:人机协同系统成熟
长期:Physical AI 实现规模化
从长期演化路径来看,AI 的发展可以被抽象为三个阶段:
认知 AI(代表:ChatGPT):解决理解与生成问题
**Agent AI:**能够在数字环境中执行任务
**Physical AI:**能够在现实世界中完成任务
这一演化路径揭示了一个核心趋势:AI 正在从“信息处理工具”转变为“现实执行系统”。
综合来看,a16z 的核心判断可以总结为三点:
AI 将进入物理世界
数据来源将发生根本变化
系统能力将取代单点模型能力
最终,AI 的终局并不是更好地理解世界,而是能够在真实环境中持续行动并产生结果。当这一能力成熟时,AI 将从工具升级为基础设施,并对产业结构与资本流向产生深远影响。





