英国公司 Oriole Networks 计划为人工智能超级计算集群打造全新的网络基础设施,该基础设施使用光而不是电来传输数据,该公司已从伦敦风险投资公司 Plural 筹集了 2200 万美元资金。
光子学是一门产生、操纵和检测光的科学,它突然成为科技行业的热门话题,作为人工智能数据中心面临的两大问题的潜在解决方案:巨大的电力需求和最大的训练时间海量数据集上的人工智能模型。就在本周,另外两家致力于人工智能芯片光子网络的公司宣布了几轮重大融资。
Lightmatter 宣布已在一项风险投资交易中筹集了 4 亿美元,该交易由 T·罗维·普莱斯 这家成立七年的公司的估值为 44 亿美元。 Xscape Photonics 宣布已完成由 IAG Capital 领投、网络设备制造商思科的风险投资部门和 英伟达 其他投资者中。
Xscape 或 Oriole Networks 的融资均未公布估值数据,这两轮融资均为 A 轮融资。
光子学突然流行的原因与科技公司在寻求建立更大的数据中心时遇到的一系列挑战有关,这些数据中心配备了数十万个专用芯片(在大多数情况下是图形处理单元(或 GPU))用于训练和运行人工智能应用程序。
传统的网络和交换设备主要使用铜线来传输电力来传递信息,其本身正在成为大型人工智能模型快速、轻松训练的瓶颈。在其他情况下,使用光纤,但单根电缆中仅传输几种颜色的光,这也限制了可以传输的信息量。
基于神经网络的人工智能模型必须在整个网络中不断地来回传输大量数据。但是,在 GPU 之间移动所有这些数据(包括那些可能位于远处服务器机架中的数据)取决于布线路径和交换设备将数据压缩发送到正确位置的能力。
Oriole Network 联合创始人 George Zervas 表示,许多大型人工智能超级计算集群的接线方式是,数据从一个计算机芯片传输到集群中其他位置的另一个计算机芯片,可能必须通过不同的网络交换机进行多达九跳才能到达目的地。首席技术官说道。
人工智能模型越大,涉及的服务器机架越多,这条布线道路就越有可能变得拥挤,类似于交通堵塞延误通勤时间。对于最大的人工智能模型,其 90% 的训练时间可能包括等待数据在超级计算集群中传输,而不是芯片实际运行必要计算所需的时间。
使用电力传输数据的传统网络设备也极大地增加了数据中心的能源需求,一方面是直接消耗电力,另一方面是因为铜线会散热,这意味着需要更多的能源来冷却数据中心。在一些数据中心,仅网络设备一项就可以占到设施整体能耗的 20%。
根据数据中心使用的能源,这种电力需求可能会产生巨大的碳足迹。与此同时,许多数据中心需要大量的水来帮助冷却用于运行人工智能应用程序的芯片架。
云计算公司预计未来人工智能数据中心的电力需求将迫使他们竭尽全力确保足够的能源。 谷歌, 亚马逊, 和 微软 所有国家都达成了核反应堆专门为其数据中心供电的协议。与此同时,OpenAI 向美国政府通报了一项可能建设多个数据中心的计划,每个数据中心每年消耗 5 吉瓦的电力,比目前整个迈阿密市的电力还要多。
光子学有可能解决所有这些挑战。使用光纤以光而不是电的形式传输数据,可以将超级计算集群中的更多芯片直接相互连接,从而减少或消除对交换设备的需求。光子学传输数据所用的电力也比电子学少得多,而且光子信号在传输过程中不会产生热量。
不同的光子公司对于如何使用该技术改造数据中心有不同的想法。 Lightmatter 正在开发一种名为 Passage 的产品,它是一个光传导表面,可以在其上安装多个 AI 芯片,从而允许该 Passage 表面上的任何芯片之间进行光子数据传输,而无需电缆连接或铜线。然后,光纤布线将用于连接单个服务器机架中的多个 Passage 产品以及机架之间的连接。 Xscape 设想使用光子设备和电缆,可以通过一根电缆传输和检测数百种不同颜色的光,从而大大增加随时流经网络的数据量。
但 Oriole Networks 的愿景可能最为广阔,它利用光子学将超级计算集群中的每个 AI 芯片连接到整个集群中的每个其他芯片。 Oriole Networks 表示,这可能会导致最大的 AI 模型(例如 OpenAI 的 GPT-4)的训练时间加快 10 到 100 倍。这也意味着网络训练所用的功率比当今人工智能超级计算集群消耗的功率少一小部分。
为了实现这一目标,Oriole 不仅设想了新的光子通信设备,还设想了帮助网络编程的新软件,以及可以充当整个网络“大脑”的新硬件设备,确定需要发送哪些信息包确切地说,在什么时刻在哪些芯片之间。
“这完全是激进的,”金莺首席执行官詹姆斯·里根说。 “网络中根本没有电子数据包交换。”
Oriole Networks 于 2023 年从伦敦大学学院分拆出来,但它依赖于其创始人(尤其是 Zervas)在过去二十年开创的技术。除了Zervas之外,他还是资深光子学研究员、UCL博士。学生 Alessandro Ottino 和博士后研究员 Joshua Benjamin(通信网络设计专家)共同创立了该公司。他们聘请了经验丰富的企业家里根(Regan)担任首席执行官,他曾帮助创建了一家以前的光子公司。
公司现有员工30人。今年 3 月份,该公司从一群投资者那里筹集了 1300 万美元的首轮种子融资,其中包括 XTX Markets 的风险投资部门,该公司运营着欧洲最大的 GPU 集群之一。 UCL Technology Fund、XTX Ventures、Clean Growth Fund 和 Dorilton Ventures 也都参与了种子轮和最近的 A 轮投资。
Regan 表示,Oriole 正在利用其他公司来制造其正在设计的光子设备,这将使该公司能够将资本要求保持在低于其他情况的水平,并使公司能够更快地发展。他表示,目标是在 2025 年向潜在客户提供初始设备进行测试。
该公司已与大多数“超大规模”云服务提供商以及多家制造 GPU 和 AI 芯片的半导体公司进行了讨论。
主导 A 轮投资的 Plural 合伙人伊恩·霍加斯 (Ian Hogarth) 表示,他被 Oriole Networks 所吸引,因为它代表了“范式转变”,而不是一种使人工智能数据中心更加节能和资源高效的渐进方法。霍加斯也是英国人工智能安全研究所的主席,他表示,“人工智能的原始雄心和速度给他留下了深刻的印象”。 [Oriole’s] 创始人带来了这个问题。”
他表示,该公司与 Plural 对帮助应对气候变化的公司进行的其他投资相一致。最后,他表示,他认为欧洲“在计算堆栈的发展方面拥有真正的硬资产,并且不要浪费将欧洲大学、英国大学的杰出发明转化为标志性公司的机会”,这一点很重要。
当然,之前有过关于光子学的炒作,但并不总是成功。在 20 世纪 90 年代末和 2000 年代初的第一次互联网热潮期间,人们对光子学成为互联网(包括交换设备)主要支柱的可能性感到非常兴奋。当时的风险投资家也向该行业注入了资金。但由于光子行业缺乏成熟度,大部分投资都未能成功。零件制造起来困难且昂贵,并且比半导体和更传统的电子开关设备具有更高的故障率。然后,当互联网泡沫破裂时,光子学的繁荣在很大程度上随之下降。
里根说,今天的情况有所不同。他说,制造光子集成电路和光子设备的公司生态系统比以前更加强大,技术也更加可靠。十年前,像 Oriole Networks 这样的公司必须自己生产大部分想要生产的设备——这是一个资本密集度更高、风险更大的提议。他说,如今,有一个可靠的合同制造商供应链可以执行金莺开发的设计。