华盛顿大学实验室的研究人员之一内特·贝内特 (Nate Bennett) 说:“这项技术最强大的地方之一就是,就像 DALL-E 一样,它会按照您的指示去做。” “从一个提示,它可以生成无数的设计。”
OpenAI 的崛起
这家位于旧金山的公司是世界上最雄心勃勃的人工智能实验室之一。 以下是最近的一些进展。
为了生成图像,DALL-E 依赖于人工智能研究人员所说的 神经网络,一个松散地模拟大脑神经元网络的数学系统。 这项技术可以识别您对智能手机发出的命令,使自动驾驶汽车能够识别(并避开)行人,并在 Skype 等服务上翻译语言。
神经网络通过分析大量数字数据来学习技能。 例如,通过在数千张柯基犬照片中精确定位模式,它可以学会识别柯基犬。 借助 DALL-E,研究人员构建了一个神经网络,该网络在分析数百万张数字图像和描述每张图像所描绘内容的文本说明时寻找模式。 通过这种方式,它学会了识别图像和文字之间的联系。
当您为 DALL-E 描述图像时,神经网络会生成该图像可能包含的一组关键特征。 一个特征可能是泰迪熊耳朵的曲线。 另一个可能是滑板边缘的线。 然后,第二个神经网络——称为扩散模型——生成实现这些特征所需的像素。
扩散模型是在一系列图像上训练的,在这些图像中,噪声——缺陷——被逐渐添加到照片中,直到它变成随机像素的海洋。 当它分析这些图像时,模型学会反向运行这个过程。 当你给它随机像素时,它会去除噪声,将这些像素转换成连贯的图像。
在华盛顿大学、其他学术实验室和新的初创企业,研究人员正在使用类似的技术来努力创造新的蛋白质。
蛋白质最初是一串化合物,然后扭曲并折叠成定义其行为方式的三维形状。 近年来,像谷歌母公司 Alphabet 旗下的 DeepMind 这样的人工智能实验室已经表明,神经网络可以准确地 猜测体内任何蛋白质的三维形状 仅基于它所含的较小化合物——这是一项巨大的科学进步。