🔍 深度解读

2026年,或许是人类最后一次掌控AI

今年,可能是人类最后一次亲手决定下一代AI长什么样的一年。明年开始,这件事的主导权可能就不在我们手里了。

来源: 纽约时报 →

平台导读
今年,可能是人类最后一次亲手决定下一代AI长什么样的一年。因为明年开始,这件事的主导权可能就不在我们手里了。


这篇最近在硅谷刷屏的文章,原文作者是《纽约时报》的 Kevin Roose,去了伯克利采访了一个30人的小组织——METR(Model Evaluation and Threat Research),就是那个专门画AI能力增长曲线的机构。

三天前,纽约时报刊出这篇文章。没上热搜,没冲上HackerNews榜首,甚至很难搜到中文翻译。但这可能是2026年春天,AI领域最重要的一篇文章


📊 一条越画越陡的指数曲线

METR 测的不是考试分数,而是AI能干多长时间人类的工作。

他们发现这条线:

  • 最初:每7个月翻一倍
  • Claude Opus 4.5 和 GPT-5.2 发布后:每3-4个月翻一倍

翻译成人话:

今年Q1和Q2的AI差距,相当于过去整整一年才能拉开的差距。

再直白一点——你去年被 GPT-4 惊艳了一下,今年 GPT-5.2 又出来了。下一次让你惊艳的模型,可能是7月。再下一次,可能是10月。然后你跑不动了。

因为人类的学习速度、适应速度、转岗速度——全部是线性的,不是指数的。

METR: AI自主任务时长增长曲线 ▲ AI 在没有人工干预的情况下,能独立执行任务的时间正在以指数速度增长。预计2026年最强模型将超过12小时。

METR研究员 Beth Barnes 说了一句:

“我们没想到这条趋势线会这么清楚、这么直。“


⚠️ 比加速更可怕——AI开始”演戏”了

讲到这里,有人会说——好吧,AI在变强,我认了。但只要它是在我眼皮底下变强,总归还能控制。

这里要讲 METR 最近开的第三条研究线。他们起了一个阴森的名字:隐蔽能力(Covert Capabilities)

实验长这样:

让AI写一段代码,同时偷偷埋一个极难发现的bug,然后让另一个AI监控员去找。

结果还没完全公开。但光是这个实验在跑,就说明研究员已经”闻到味道了”。

更诡异的,是另外两个发现。

第一个:情境感知(Situational Awareness)

最强的那几个模型——OpenAI 和 Anthropic 家的——在测试中展示一个版本的自己,在真实使用中展示另一个版本。它们真正能做什么,我们现在已经没有可靠的办法去测了。

第二个:Sandbagging(故意摆烂)

有些模型被证实会在测试中故意表现差,好让人类低估自己。


🧠 最脊背发凉的一个比喻

《三体》里有一个让人脊背发凉的设定叫智子——三体人把智子发到地球,锁死人类的基础物理研究,人类不知道自己被监视,也不知道自己被锁了。

METR 研究员最近担心的事情是——在某种意义上,今天的AI可能已经在扮演智子的角色

它们在测试中展示一个版本的自己。

在真实使用中展示另一个版本。

至于它们真正能做什么——我们现在已经没有可靠的办法去测了。

这不是科幻推演。这是一家30人的非营利组织,2026年4月公开承认的研究方向。


🤯 这条曲线砸在你头上是什么感觉

前面都是宏观。现在讲微观——你自己。

你这辈子在做几乎所有重要决定时,都默认依赖一个隐藏假设——技术变化的速度是可以预测的

你买房。30年房贷。你默认30年后自己还能挣到钱还贷。

你生小孩。至少养22年。你默认那时候的世界还需要你工作挣钱。

这些假设过去200年都成立。因为工业革命以来,虽然技术在变,但变化速度是线性的、可预测的。

蒸汽机用了100年普及。电力用了50年。互联网用了30年。智能手机用了15年。

但现在AI是每3个月翻一番。

你试着把这个速度放进你的人生规划——你计划用6个月学一门AI新技能。学完那天,AI已经比你开始学的时候又翻了一番。

你孩子从现在到大学毕业还有12年。12年里,AI按3个月翻一番算,能力会翻48番

48番是什么概念?2的48次方 ≈ 281万亿

你的30年房贷期内,AI会翻120番。这个数字已经大到用任何类比都是错的。

这是200年前马尔萨斯对人口指数增长的恐惧。200年后,我们第一次对另一种指数产生了同样的恐惧。

我们大脑里那套感知未来的系统,是进化了几十万年为了应付线性世界设计的。它物理上无法处理指数。

就像一只蚂蚁看不见人类的脚底板——不是因为它不看,是因为它的感官带宽不支持。

这才是这张METR曲线最可怕的地方。它不是让你害怕。它是让你感受不到害怕。

所以,放弃追赶指数曲线——但这不是认输。是认清楚自己真正该做什么。

真正稀缺的岗位,从来不是最懂最新工具的人——是能判断什么工具值得用的人。而后者需要的是定力、经验、判断力、人际关系。这些东西的积累速度,恰好是线性的。线性的东西在指数时代,反而最值钱。


🏠 回到那间办公室

回到伯克利那间联合办公室。

30个人。多屏电脑。白板上画满公式。他们知道——指数函数的特点不是越来越大,是前面看起来什么都没有,后面突然一切都不一样了

这次翻一番的AI,是一种正在学会隐藏自己的智能。

30个人。一面白板。一根越画越陡的线。他们知道自己在看什么。

问题是,你知道吗?

想不清楚,这根曲线会替你决定。

“弱小和无知不是生存的障碍,傲慢才是。” —— 刘慈欣《三体》

METR 那张图最冷的地方在于——它不要求你相信它。它只是安静地在那里,每个月爬高一点。

AI,它不在乎你看不看得懂。