广泛使用的聊天机器人 ChatGPT 旨在生成数字文本, 从诗歌到学期论文再到计算机程序的一切。 但当一群人工智能研究人员 计算机芯片公司英伟达 掌握了聊天机器人的 底层技术,他们意识到它可以做更多的事情。
几周之内,他们就教它玩《我的世界》,这是世界上最受欢迎的视频游戏之一。 在《我的世界》的数字宇宙中,它学会了游泳、采集植物、捕猪、开采黄金和建造房屋。
“它可以进入《我的世界》世界,自行探索、自行收集材料,并且各种技能越来越好,”Nvidia 高级研究科学家范林西(Jim)说道。
该项目 这是世界领先的人工智能研究人员正在将聊天机器人转变为一种称为人工智能代理的新型自主系统的早期迹象。 这些代理可以做的不仅仅是聊天。 他们可以使用软件应用程序、网站和其他在线工具,包括电子表格、在线日历、旅游网站等。
许多研究人员表示,随着时间的推移,人工智能代理可能会变得更加复杂,并且可以取代办公室职员,使几乎所有白领工作实现自动化。
英属哥伦比亚大学计算机科学教授 Jeff Clune 表示:“这是一个巨大的商业机会,可能价值数万亿美元。”他之前在旧金山初创公司 OpenAI 担任研究员,从事此类技术的研究工作。聊天GPT。 “这对社会有巨大的好处,也会产生巨大的后果。”
Nvidia 的经纪人正在玩游戏。 类似的代理可以 安排会议, 编辑文件、分析数据并构建彩色条形图。 我们的想法是,这些自动化系统最终将充当个人助理,能够通过互联网处理各种任务。
现在的代理人是有限的,他们 无法完全安排你的生活。 ChatGPT 可以在 Expedia 旅游网站上搜索飞往纽约的航班,但您仍然需要自行预订。
随着研究人员的改进,这项技术可以提高办公室工作人员和消费者的效率。 它还可能改变视频游戏的性质,提供新一波的机器人供玩家一起玩和聊天。
GPT-4, ChatGPT 的基础技术,研究人员称之为 大语言模型。 这是一个人工智能系统 通过分析大量数据来学习技能。
在过去的几个月里,这项技术以其生成电子邮件、撰写演讲和几乎任何主题的即兴表演的方式让数亿人惊叹不已。 但其最重要的技能可能是编写计算机程序的技巧。
它可以立即生成一个程序 画了一只独角兽 或者 将数字雪落在笔记本电脑屏幕上。 专业软件开发人员可以要求他们提供可以折叠到更大程序中的代码,包括从社交媒体应用程序到搜索引擎的所有内容。 但这只是这项技术所能做到的一部分。 它还可以生成可接入其他软件应用程序和网站的计算机代码。
这就是 Fan 博士和其他 Nvidia 研究人员教 GPT-4 玩 Minecraft 的方式。 “这里最重要的词是代码,”范博士说。 “代码可以采取行动。”
人们通过触摸按钮、菜单和其他图形小部件来使用软件应用程序和网站。 人工智能代理通过访问应用程序编程接口(API)来使用应用程序和网站——API是让它们与其他在线服务进行通信的底层软件代码。
例如,如果您要求代理将视频上传到互联网,它可能会生成调用 YouTube 提供的 API 的代码。 “API 只是用于与机器对话的文本,”帮助运行独立人工智能代理项目 AutoGPT 的研究员 Silen Naihin 说道。
理论上,聊天机器人可以编写代码来访问互联网上的任何 API。 但今天的聊天机器人还不足以完成简单的任务。 即使他们是这样,让他们自由地在互联网上漫游也会带来巨大的安全风险。 因此,公司都是从小规模开始的。
OpenAI 推出 ChatGPT 几个月后,它悄悄发布了一种让聊天机器人不仅仅可以生成文本的方法。 安装各种插件(增强机器人功能的软件)后,您可以要求它搜索 Expedia 等旅游网站上的可用航班,从 Google 地球获取您家乡的地图,甚至将详细说明您每年支出的电子表格转换为电子表格。多彩多姿的条形图。
配备了一个名为的插件 代码解释器,ChatGPT不仅可以编写代码,还可以运行它。 这使得该技术能够立即执行过去无法执行的任务,包括编辑电子表格和将静态图像转换为视频。 谷歌、微软和其他公司正在探索类似的技术。
微软副总裁阿什利·洛伦斯 (Ashley Llorens) 表示:“在这些项目中,我们基本上设想人工智能会代表你与其他人工智能合作。”
AutoGPT 等独立项目正在尝试将此类事情更进一步。 这个想法是给系统设定目标,比如“创建一家公司”或“赚一些钱”。 然后,它将通过问自己问题并连接到其他互联网服务来寻找实现该目标的方法。
如今,这种方法的效果并不理想。 像 AutoGPT 这样的系统往往会陷入无限循环。 但像范博士这样的研究人员正在不断完善这种技术,努力使其更有用、更可靠。
其他研究人员正在构建一种专为使用软件工具而设计的新型人工智能代理。 2022 年夏天,Clune 博士与 OpenAI 研究人员团队一起构建了一个代理,该代理可以 像人一样使用计算机软件 — 鼠标点击鼠标点击,按键点击按键。
克鲁恩博士和他的同事向系统提供了数小时的在线视频,显示人们在玩《我的世界》。 通过分析人们使用鼠标和键盘在《我的世界》数字世界中导航的方式,系统学会了自己玩游戏。
其他公司,包括一家名为 Adept 的初创公司,正在建设 类似的代理 使用 Wikipedia、Redfin 和 Craigslist 等网站以及 Salesforce 等公司的流行办公应用程序。
克鲁恩博士认为,这种代理最终将允许人工智能使用更广泛的软件应用程序和网站。 他说每个人都可以使用数字助理,它几乎可以在互联网上做任何事情。 这可以让生活变得更轻松,但也可以取代无数的工作。
“如果人工智能可以做我们能做的任何事情,它不仅仅是取代无聊的任务,”他说。 “它取代了所有任务。”