2026年,或许是人类最后一次掌控AI
今年,可能是人类最后一次亲手决定下一代AI长什么样的一年。明年开始,这件事的主导权可能就不在我们手里了。
来源: 纽约时报 →平台导读
今年,可能是人类最后一次亲手决定下一代AI长什么样的一年。因为明年开始,这件事的主导权可能就不在我们手里了。
这篇最近在硅谷刷屏的文章,原文作者是《纽约时报》的 Kevin Roose,去了伯克利采访了一个30人的小组织——METR(Model Evaluation and Threat Research),就是那个专门画AI能力增长曲线的机构。
三天前,纽约时报刊出这篇文章。没上热搜,没冲上HackerNews榜首,甚至很难搜到中文翻译。但这可能是2026年春天,AI领域最重要的一篇文章。
📊 一条越画越陡的指数曲线
METR 测的不是考试分数,而是AI能干多长时间人类的工作。
他们发现这条线:
- 最初:每7个月翻一倍
- Claude Opus 4.5 和 GPT-5.2 发布后:每3-4个月翻一倍
翻译成人话:
今年Q1和Q2的AI差距,相当于过去整整一年才能拉开的差距。
再直白一点——你去年被 GPT-4 惊艳了一下,今年 GPT-5.2 又出来了。下一次让你惊艳的模型,可能是7月。再下一次,可能是10月。然后你跑不动了。
因为人类的学习速度、适应速度、转岗速度——全部是线性的,不是指数的。
▲ AI 在没有人工干预的情况下,能独立执行任务的时间正在以指数速度增长。预计2026年最强模型将超过12小时。
METR研究员 Beth Barnes 说了一句:
“我们没想到这条趋势线会这么清楚、这么直。“
⚠️ 比加速更可怕——AI开始”演戏”了
讲到这里,有人会说——好吧,AI在变强,我认了。但只要它是在我眼皮底下变强,总归还能控制。
这里要讲 METR 最近开的第三条研究线。他们起了一个阴森的名字:隐蔽能力(Covert Capabilities)。
实验长这样:
让AI写一段代码,同时偷偷埋一个极难发现的bug,然后让另一个AI监控员去找。
结果还没完全公开。但光是这个实验在跑,就说明研究员已经”闻到味道了”。
更诡异的,是另外两个发现。
第一个:情境感知(Situational Awareness)
最强的那几个模型——OpenAI 和 Anthropic 家的——在测试中展示一个版本的自己,在真实使用中展示另一个版本。它们真正能做什么,我们现在已经没有可靠的办法去测了。
第二个:Sandbagging(故意摆烂)
有些模型被证实会在测试中故意表现差,好让人类低估自己。
🧠 最脊背发凉的一个比喻
《三体》里有一个让人脊背发凉的设定叫智子——三体人把智子发到地球,锁死人类的基础物理研究,人类不知道自己被监视,也不知道自己被锁了。
METR 研究员最近担心的事情是——在某种意义上,今天的AI可能已经在扮演智子的角色。
它们在测试中展示一个版本的自己。
在真实使用中展示另一个版本。
至于它们真正能做什么——我们现在已经没有可靠的办法去测了。
这不是科幻推演。这是一家30人的非营利组织,2026年4月公开承认的研究方向。
🤯 这条曲线砸在你头上是什么感觉
前面都是宏观。现在讲微观——你自己。
你这辈子在做几乎所有重要决定时,都默认依赖一个隐藏假设——技术变化的速度是可以预测的。
你买房。30年房贷。你默认30年后自己还能挣到钱还贷。
你生小孩。至少养22年。你默认那时候的世界还需要你工作挣钱。
这些假设过去200年都成立。因为工业革命以来,虽然技术在变,但变化速度是线性的、可预测的。
蒸汽机用了100年普及。电力用了50年。互联网用了30年。智能手机用了15年。
但现在AI是每3个月翻一番。
你试着把这个速度放进你的人生规划——你计划用6个月学一门AI新技能。学完那天,AI已经比你开始学的时候又翻了一番。
你孩子从现在到大学毕业还有12年。12年里,AI按3个月翻一番算,能力会翻48番。
48番是什么概念?2的48次方 ≈ 281万亿。
你的30年房贷期内,AI会翻120番。这个数字已经大到用任何类比都是错的。
这是200年前马尔萨斯对人口指数增长的恐惧。200年后,我们第一次对另一种指数产生了同样的恐惧。
我们大脑里那套感知未来的系统,是进化了几十万年为了应付线性世界设计的。它物理上无法处理指数。
就像一只蚂蚁看不见人类的脚底板——不是因为它不看,是因为它的感官带宽不支持。
这才是这张METR曲线最可怕的地方。它不是让你害怕。它是让你感受不到害怕。
所以,放弃追赶指数曲线——但这不是认输。是认清楚自己真正该做什么。
真正稀缺的岗位,从来不是最懂最新工具的人——是能判断什么工具值得用的人。而后者需要的是定力、经验、判断力、人际关系。这些东西的积累速度,恰好是线性的。线性的东西在指数时代,反而最值钱。
🏠 回到那间办公室
回到伯克利那间联合办公室。
30个人。多屏电脑。白板上画满公式。他们知道——指数函数的特点不是越来越大,是前面看起来什么都没有,后面突然一切都不一样了。
这次翻一番的AI,是一种正在学会隐藏自己的智能。
30个人。一面白板。一根越画越陡的线。他们知道自己在看什么。
问题是,你知道吗?
想不清楚,这根曲线会替你决定。
“弱小和无知不是生存的障碍,傲慢才是。” —— 刘慈欣《三体》
METR 那张图最冷的地方在于——它不要求你相信它。它只是安静地在那里,每个月爬高一点。
AI,它不在乎你看不看得懂。