Baseten 是新一波类别定义应用程序背后的人工智能推理平台,已完成 3 亿美元的 E 轮融资,估值为 50 亿美元。 IVP、CapitalG 和 NVIDIA 共同参与了此次投资,这标志着该公司在短短 12 个月内进行的第三次融资。
本轮融资反映了对能够在生产环境中可靠运行现代人工智能模型的高性能基础设施的需求激增。其他投资者包括 01A、Altimeter、Battery Ventures、BOND、BoxGroup、Blackbird Ventures、Conviction 和 Greylock。通过最新的注资,Baseten 自 2019 年成立以来现已筹集 5.85 亿美元。
为应用程序提供动力,重塑人们的工作方式
六年的专注开发使 Baseten 成为许多人工智能产品背后的推理平台,改变了各行业的工作流程。该公司的客户包括 Cursor、OpenEvidence、Abridge、Notion 和 Clay,以及其他为其特定领域构建专门模型的客户。
“Baseten 让我们能够以我们需要的方式运行我们需要的模型。性能是一流的,但让他们与众不同的是其他一切:可靠性、开发人员体验,以及他们不断寻找降低我们成本的方法这一事实。他们是合作伙伴,而不是供应商。”
Shiv Rao,Abridge 联合创始人兼首席执行官
该平台在过去一年中经历了爆炸性增长,随着越来越多的公司从实验转向生产规模的人工智能部署,推理量增加了 100 倍。
推理成为主导的人工智能工作负载
人工智能行业正在迅速从训练越来越大的模型转向大规模部署模型。行业分析师估计,到 2026 年底,推理将占所有人工智能计算的三分之二,比 2023 年的三分之一大幅上升。随着推理和思维模型需要比前几代更多数量级的计算资源,这种转变正在加速。
“如果说云是上一代伟大科技公司的基础,那么推理就是下一代的基础。每一个突破性的人工智能应用都依赖于快速、可靠且经济高效的推理。我们花了六年时间构建基础设施,以实现这一目标,我们已经准备好迎接数百个甚至数千个新模型的下一个篇章。”
Tuhin Srivastava,Baseten 联合创始人兼首席执行官
这项投资凸显了更广泛的市场转变。跨行业的组织不再仅仅依赖少数几个巨型模型,而是越来越多地根据其特定用例和客户需求构建定制和特定领域的模型。
资本部署侧重于速度、可靠性和开发人员体验
新资金将加速 Baseten 在三个核心领域的平台开发。该公司计划提高基础设施性能,加强正常运行时间保证,并扩展其开发人员工具和经验。这些改进将支持客户为从软件开发到医疗文档和法律分析的各个方面建立精确的模型。
“我们的客户正在为从精英软件开发到医疗文档再到高风险法律推理的所有事物构建精确的模型,他们需要一个能够让他们提供深度特异性、专业知识和性能的平台。这就是我们致力于实现的用户体验类型以及人工智能的承诺。”
图希·斯里瓦斯塔瓦
展望未来,Baseten 将构建其所描述的人工智能基础设施平台,涵盖推动推理工作负载增加的每个场景。随着人工智能嵌入到各行业的产品和工作流程中,该公司认为推理将成为有史以来最大的计算市场之一。
为多模式生态系统构建基础设施
Baseten 成立于 2019 年,总部位于旧金山,其平台围绕一个基本信念构建:未来不属于少数巨型模型,而是属于数千个专业模型。该公司的基础设施旨在支持这种多模型生态系统,具有强大的护栏、安全性和可观察性功能,使组织能够控制其部署。
该平台的架构使用开放运行时而不是专有权重,避免了客户模型的锁定,并结合了多云灵活性来优化可靠性和成本。这种方法使公司能够在访问企业级基础设施的同时保持其差异化和知识产权的所有权。
联合创始人 Tuhin Srivastava 和 Amir Haghighat 创立该公司的初衷是:快速、可靠和安全的推理将成为人工智能功能与现实世界业务影响之间的重要纽带。这一愿景已通过一系列市场拐点得到验证,从早期的 Whisper 和 Stable Diffusion 等模型到 Llama 系列和扩散变压器,再到最近由 DeepSeek、Qwen 和 GPT-OSS 引领的开源浪潮。
投资者对平台经济和市场地位的看法
“Baseten 正在迅速成为默认基础设施,”Conviction 普通合伙人 SarahGuo 表示。 “在这个世界上,每个雄心勃勃的人工智能团队都希望运行许多模型并完全拥有其 IP,Baseten 为他们提供了大规模实现这一目标的自由、可靠性和经济性。这种组合——开放运行时、多云弹性和深思熟虑的开发人员体验——是最好的公司所期望的新标准。”
快速的融资步伐反映了投资者的信心和市场的紧迫性。 Baseten 在 12 个月内完成了三轮融资,已经获得了构建该公司所说的“最雄心勃勃的版本”平台所需的资金。由于强化学习使团队能够直接根据特定工作流程定制模型,消费者和企业领域对强大推理基础设施的需求持续加速。

