这个故事最初出现在我们关于人工智能的每周通讯《算法》中。要首先在您的收件箱中收到这样的故事, 在这里注册。
在一个不会停滞不前的行业,斯坦福大学的人工智能指数, 主要成果和趋势的年度综述,是一个喘口气的机会。 (这是一个 马拉松,不是短跑, 毕竟。)
今年的报告今天下跌的数据充满了惊人的数据。很多价值来自于有数字来支持你可能已经有的直觉,比如美国比其他国家更努力地发展人工智能:它拥有 5,427 个数据中心(并且还在增加)。这是其他国家的 10 倍多。
这也提醒人们,人工智能行业所依赖的硬件供应链存在一些主要的瓶颈。这也许是最引人注目的事实:“台积电这一家公司几乎制造了所有领先的人工智能芯片,使得全球人工智能硬件供应链依赖于台湾的一家代工厂。”一家铸造厂!这太疯狂了。
但我从 2026 年人工智能指数中得到的主要结论是,目前人工智能的状况充满了不一致的情况。正如我的同事米歇尔·金今天在她的书中所说的那样 关于该报告的文章:“如果你关注人工智能新闻,你可能会感到头疼。人工智能是淘金热。人工智能是泡沫。人工智能正在抢走你的工作。人工智能甚至无法读取时钟。” (斯坦福大学的报告指出,谷歌 DeepMind 的顶级推理模型 Gemini Deep Think 在国际数学奥林匹克竞赛中获得了金牌,但有一半的时间无法读取模拟时钟。)
米歇尔出色地报道了报告的要点。但我想详细讨论一个我无法回避的问题。为什么现在很难确切地了解人工智能正在发生什么?
最大的差距似乎是专家和非专家之间。 “人工智能专家和普通公众对技术发展轨迹的看法截然不同,”人工智能指数的作者写道。 “在评估人工智能对就业的影响时,73%的美国专家持积极态度,而公众的这一比例仅为23%,差距达50个百分点。在经济和医疗保健方面也出现了类似的分歧。”
那是一个 巨大的 差距。这是怎么回事?有哪些是专家知道而公众不知道的? (这里的“专家”是指参加 2023 年和 2024 年人工智能会议的美国研究人员。)
我怀疑所发生的部分原因是专家和非专家的观点基于截然不同的经验。一位软件开发人员表示:“你对人工智能的敬畏程度与你使用人工智能编码的程度完全相关。” 前几天发布在 X 上。也许这有点开玩笑,但肯定有其道理。
来自顶级实验室的最新模型现在比以往任何时候都更擅长生成代码。由于编码等技术任务有正确或错误的结果,因此与更开放的任务相比,训练模型来完成这些任务更容易。更重要的是,事实证明,可以编码的模型是有利可图的,因此模型制造商正在投入资源来改进它们。
这意味着使用这些工具进行编码或其他技术工作的人们正在体验这项技术的最佳状态。除了这些用例之外,您还会得到更多的混合包。法学硕士仍然会犯愚蠢的错误。这种现象被称为“锯齿状边界”:模型非常擅长做某些事情,而不太擅长做其他事情。
颇具影响力的人工智能研究者 安德烈·卡帕蒂 也有了一些想法。 “根据我的判断 [timeline] 他在回复那篇 X 帖子时写道:“对人工智能能力的理解差距越来越大。”他指出,高级用户(即使用法学硕士进行编码、数学或研究的人)不仅能及时了解最新模型,而且通常会每月支付 200 美元购买最好的版本。“截至今年,这些领域的最新进展简直令人震惊,”他继续说道。
由于法学硕士仍在快速进步,因此付费使用 Claude Code 的人实际上将使用与六个月前尝试使用 Claude 免费版本计划婚礼的人不同的技术。这两群人正在互相交谈。
那我们会怎样呢?我认为有两个现实。是的,人工智能比很多人意识到的要好得多。是的,它在很多人关心的很多事情上仍然很糟糕(而且可能会保持这种状态)。任何对双方未来下注的人都应该牢记这一点。

