← 返回列表

Blog 详情

Morgan Stanley:GPT-5.4拿下83%专业基准分,AI能力非线性跳跃将在2026年上半年发生——大多数企业还没准备好

2026年3月13日 · WaymoChang

核心摘要

Morgan Stanley在旧金山TMT年会上发布警告:大型语言模型正在经历一次规模扩展法则驱动的非线性跳跃,时间窗口在2026年4月至6月。OpenAI GPT-5.4在衡量44种职业专业知识工作质量的基准测试中得分83%,数月前还只有70.9%。与此同时,AI算力扩张正在与电网容量正面冲突——美国预计到2028年将面临9至18吉瓦的电力缺口。

【版权说明】本文为中文深度解读与观点整理,不是原文逐字翻译。原始内容版权归摩根士丹利及相关报道方所有。

原始信源:Morgan Stanley Technology, Media and Telecom Conference 2026(2026-03-13,旧金山),以及公开报道https://www.neuralbuddies.com/p/morgan-stanley-says-massive-ai-leap-months-away-world-not-ready

一、一个让华尔街分析师吐咖啡的预测

Morgan Stanley在2026年3月13日旧金山TMT(科技、媒体与电信)年会上发布了一份让投资界高度紧张的研究警告:LLM(大型语言模型)的能力提升正在遵循一条非线性曲线,并将在2026年4月至6月之间出现一次量变到质变的跳跃。

这不是摩根士丹利第一次对AI发出乐观预测,但这次的措辞很不一样——他们用的词是大多数企业没有准备好(most companies are not prepared for),而不仅仅是这是个机会。

二、GPT-5.4的83%说明什么

OpenAI的GPT-5.4在一个衡量跨44种职业专业知识工作质量的行业基准测试中拿到了83%的分数。数月前,这个数字还是70.9%。

这不是玩具级别的提升。从70.9%到83%意味着:在一些此前只有资深律师、医生、工程师、财务分析师才能完成的任务上,AI模型已经开始逼近专业水平。摩根士丹利估计,如果这条曲线继续,未来几个月内会有更多职业出现AI达到专业熟练门槛的信号。

值得一提的是:这个基准测试是跨职业、跨学科的综合性评估,而不是某个AI厂商自己搭建的表扬自己测试。

三、为什么是非线性?背后的推理逻辑

摩根士丹利的判断依据是算力累积效应。

2025年到2026年上半年,全球顶级AI实验室完成了史上规模最大的一轮计算基础设施建设:OpenAI、Anthropic、xAI、Google DeepMind和Meta,在这18个月里投入的GPU算力,远超此前所有阶段的总和。

按照Scaling Laws的历史规律,当算力累积到一个新量级时,模型能力往往不是线性进步,而是出现跃升——以前在不能用和勉强可用之间摇摆的任务,突然变成可靠可用。

摩根士丹利估计这个跃升点就在2026年二季度。

四、但有一个严重的卡脖子问题:电网

报告里最让基础设施投资者紧张的部分不是模型能力,而是电力。

根据摩根士丹利引用的数据,美国预计到2028年将面临9至18吉瓦(GW)的电力缺口——这是为了支撑AI数据中心扩张所需的电力,与现有电网容量之间的差值。

9-18 GW是什么概念?大约相当于9至18座大型核电站或燃气发电站的装机容量。美国目前的新建电力基础设施速度,根本跟不上AI算力消耗的增速。

这意味着AI能力曲线和电网容量曲线正在走向正面冲突。谁先到达瓶颈,谁就会成为AI扩张时间线的限速因素。

五、企业层面:4%的净裁员,以及5人公司

摩根士丹利在报告中还引用了一项跨5个国家、约1,000名高管的调查结果:在过去12个月内,由于AI驱动的效率提升,企业已经产生了4%的净员工减少。

OpenAI CEO Sam Altman在同期场合则更直接地表示,AI已经可以让5个人运营一家原本需要几百人才能运营的公司。

这两个数字放在一起,让劳动力市场的AI冲击从预测变成了现实数据。4%在宏观上看起来不大,但这仅仅是一年内的起点——如果能力曲线真的在二季度非线性跳跃,后续的速度可能会让4%显得很保守。

六、该怀疑什么

摩根士丹利的预测不是没有争议。报告同时引用了一个值得警惕的数字:在被调查的AI专家中,有76%认为单纯靠把现有架构再扩大,不太可能产生通用人工智能(AGI)。

更深的问题在于:基准分数与真实世界表现之间仍然存在一条沟。83%的专业基准分并不等于AI已经能取代83%的工作,因为很多工作的核心在于情境判断、关系维护、临场应变,而不仅仅是知识调取。

另外,摩根士丹利的预测存在明显的自我激励成分:他们管理着大量AI相关股票和基础设施投资,AI即将非线性跳跃的叙事对维持高估值有利。

但即便打五折,这份报告描述的趋势方向,是真实的。

七、对银发科技与医疗AI的连带意义

这个背景对我们持续关注的银发科技和医疗AI赛道有直接影响:

当AI在专业知识工作上的平均表现从70.9%跳到83%,意味着AI辅助诊断、风险预测、临床决策支持工具的底座能力正在快速提升。新加坡MOH本月宣布的AI慢病风险预测工具,就是建立在这一层底座之上的产品落地。

同时,随着AI替代效率的提升,医疗机构、保险公司、照护运营商都会面临人力结构再平衡的压力,类似Meta这轮裁员逻辑背后的财务压力,也会逐渐传导到非科技行业。

这是一个需要持续跟踪、不能只看单点新闻的长期结构性变化。