编者按: 拒绝“AI 套壳”的平庸:要么成为大模型的“供货商”,要么去发明那些只有 AI 才能实现的全新生意。文章来自编译。
在过去的八年里,我先后在 Andreessen Horowitz 以及我现在创办的 Worldbuild 担任投资人,见证了同样模式的不断重演。软件行业曾陷入一个同质化的时代,其发展路径往往由驾轻就熟的融资套路决定,而非真正的创新。同样的单位经济效益,同样的增长曲线,同样的 C 轮及更远的发展路径。创始人往往为了融资里程碑而非构建可持续发展的业务进行优化,导致许多公司以过高的估值筹集了过多的资金。
随着生成式人工智能的兴起和宽松货币政策的终结,那个时代已经落幕。作为一名投资人,我感到非常兴奋;AI 终于开启了自移动革命以来久违的真正创新潜力。然而,我看到一些创始人仍在为营销或金融领域构建专业的 AI 产品,就好像他们还在打造过去十年的那种订阅制软件工具一样。那些仍套用旧框架的人,即将犯下一个巨大的错误。
在这个时代,为了实现足以吸引风险投资人的成果(即数十亿美元规模的退出),当今的创始人需要汲取图灵奖得主、强化学习先驱理查德·萨顿(Richard Sutton)提出的“苦涩的教训”。萨顿的预言最早在 2010 年代初的计算机视觉领域(一个训练计算机解读视觉图像信息的早期 AI 领域)得到证实:当时,算法复杂度较低但数据量更大的系统,彻底推翻了统治该领域多年的手工编程方法。专业化最终会输给拥有更多算力和训练数据的更简单的系统。但为什么说这是一个“苦涩的教训”呢?因为这要求我们承认一个难以接受的事实:我们直觉上认为的人类专业知识优于规模效应的观点是错误的。
这种现象已经在发生。事后看来,基础模型会让早期的 AI 写作工具变得毫无意义,这似乎已显而易见;但同样的命运正降临在每一个将 AI 模型“强行接入”现有工作流的专业 AI 工具上——无论是在金融、法律,甚至是在自动代码生成领域。这些专用工具都坚信自己可以通过模型构建特定的工作流来击败基础模型,但核心问题在于,基础模型的能力正变得越来越强。如下表所示,通用模型能够完成的任务长度每七个月就会翻一倍。它们的发展轨迹正威胁着要吞噬掉建立在其之上的任何“套壳”应用。
在与数百位利用 AI 创业的早期创始人交流后,我看到了两条道路正在慢慢呈现。一条通向那“苦涩的教训”——并在 18 个月内变得无足轻重;另一条则通向定义这个时代的伟大企业。这些定义时代的业务分为两类:一类是构建模型进化所需的资源——算力、训练数据和基础设施;另一类则是发现那些只有靠 AI 才能实现的工作。
让我们深入探讨这两类业务的具体面貌,以及如何判断你属于哪一类。
你缺的不是创意,你缺的是时间。
第一条路径:模型经济 与“苦涩的教训”并行的构建方式之一,是既把 AI 看作是一种构建工具,也看作是一个构建目标。关于后者,我指的是那些开发能让模型能力得以实现并增强的数据或基础设施的业务,而不是单纯开发目前那些利用 AI 的应用。我称之为“模型经济”。
许多规模化发展的公司已经通过直接向实验室供货来顺应这一转变。其中包括甲骨文(Oracle),其为模型构建者提供算力的合同储备已增至近 5000 亿美元。AI 云计算公司 CoreWeave 和 Crusoe 同样是这股浪潮的受益者,它们从比特币挖矿转型为 AI 实验室提供算力和数据中心;Scale AI 也是如此,该公司最近获得了 Meta 的 140 亿美元投资,用于为训练大语言模型提供高质量的标注数据。
模型经济的四大机遇 在以下四个领域,将会诞生大型且可持续发展的模型经济企业:
算力商品化
AI 能力将继续沿指数曲线扩展,这需要更多的算力(芯片)和能源。但短期内,波动在所难免:超大规模云服务商在同一季度内可能会在 GPU(驱动 AI 的专用处理器)过剩与短缺之间剧烈摆动。比方说,微软在今年早些时候就经历了从 GPU 过剩到短缺的转变。最具生命力的初创企业将同时应对两种现实:AI 对算力需求的确定性,以及供应紧缺与过剩交替的混乱。我们一直在投资“交易所模式”——即匹配算力或能源供需、提高资产利用率(比方说确保芯片满负荷运行而非半负荷运行)并构建这些资源交易机制的公司,如 AI 算力市场 San Francisco Compute Company 和 Fractal Power。这些公司能够抵御波动,甚至从中获益。Meta 进军批发电力交易,旨在为快速增长的 AI 数据中心保障灵活的电力供应,这一举动预示了未来的方向。首先我们将交易驱动 AI 的电力,然后我们将交易算力本身。
运行在设备端的 AI
由于延迟(或实时响应需求)、隐私、连接性或成本限制,某些 AI 无法在云端运行。比方说,一位对冲基金分析师希望模型对交易策略进行数天的推理,而不将其暴露给任何人。在这一类别中,专用的硬件和网络在本地运行和管理强大的 AI 模型,而不是在别人的云端。获胜者将把硬件和软件紧密结合,以实现发生在设备端的 AI 体验。Meta 对可穿戴设备的持续投资就是一个例子,初创公司 Truffle 也是如此,他们正在为 AI 模型构建专门的计算机和操作系统。这一类别还可能包括创建本地 AI 网络的初创公司,这些网络可以汇集来自各种来源的计算能力,包括电脑、显卡、游戏机甚至机器人车队。
在多智能体协作领域,我已经体验到了后拟物化应用的潜力。作为一名投资人,我使用多个模型来扮演不同的角色,它们与我一起互相提示,创建了一个类似虚拟投资委员会的东西。我让一个模型生成提示词,然后将该提示词输入到另一个模型中。当我只使用单一供应商的模型时,我发现它会陷入停滞或自我循环。但当我引入多个模型时,结果往往能跳出那种“阿谀奉承”的循环(sycophantic spiral)。(你可以通过 Andrej Karpathy 的 LLM Council 亲自尝试一下。)
像 Datadog 这样的监控平台通过观察大型软件系统来确保其正常运行。通常情况下,当发现问题时,系统会向人类工程师发出警报,由后者负责修复。拟物化的 AI 方法会增加更智能的仪表盘和更好的根因建议,但仍将人类保留在决策环节中。而真正的后拟物化系统则通过持续的自主反馈循环彻底排除人为干预。当 API 响应时间激增时,系统不仅仅是提醒工程师,而是会生成关于潜在原因的假设,启动并行基础设施以安全地测试修复方案,并自动实施显示出改进效果的解决方案。每一次干预都会教给系统更好的预测和预防策略,从而创造出无需人类干预就能自我观察、自我诊断和自我愈合的软件。