正如他们的名字一样, 生成式人工智能 模型根据用户的提示生成文本、图像、代码或其他响应。 正确利用它们的组织可以看到无数的好处——从提高运营效率、改进决策到快速创建营销内容。 但是,是什么使得这些模型的生成功能成为可能,并最终为组织带来好处呢?
这就是基础模型发挥作用的地方。 它是为生成模型提供传统机器学习模型所缺乏的增强推理和深度学习能力的底层引擎。 基础模型与数据存储一起,可以为希望优化客户服务、营销、人力资源(包括人才招聘)和 IT 功能的各行业组织创建和定制生成式 AI 工具。
基础模型:生成式人工智能背后的驱动力
也称为变压器, 基础模型 是一种经过大量广泛数据训练的人工智能算法。 “基础模型”一词由斯坦福以人为中心的人工智能研究所于 2021 年创造。
基础模型建立在 神经网络 模型架构可以像人脑一样处理信息。 基础模型可以经过训练,以高精度执行数据分类、图像中对象识别(计算机视觉)和自然语言处理(NLP)(理解和生成文本)等任务。 他们还可以进行自我监督学习,以概括他们的知识并将其应用到新任务中。
数据科学家无需花费时间和精力从头开始训练模型,而是可以使用预先训练的基础模型作为起点,为特定用例创建或定制生成式 AI 模型。 例如,基础模型可以用作生成人工智能模型的基础,然后使用其他制造数据集进行微调,以帮助发现更安全、更快速的方法来制造某种产品。
一种称为大语言模型 (LLM) 的特定基础模型是在 NLP 任务的大量文本数据上进行训练的。 BERT(来自 Transformers 的双向编码器表示)是最早开发的 LLM 基础模型之一。 作为一种开源模型,Google 在 2018 年创建了 BERT。它在大型英语语言数据语料库上进行了自我监督预训练,可用于各种任务,例如:
- 分析客户/观众情绪
- 回答客户服务问题
- 根据输入数据预测文本
- 根据用户提示生成文本
- 总结大型、复杂的文档
基础模型与传统机器学习模型
用于生成人工智能的基础模型不同于传统的机器学习模型,因为它可以在大量未标记的数据上进行训练,以支持生成内容或执行任务的应用程序。
同时,传统的机器学习模型通常被训练为使用标记数据执行单个任务,例如使用汽车的标记图像来训练模型,然后识别未标记图像中的汽车。
关注企业价值的基础模型
IBM的 沃森x.ai工作室 A 语言和代码基础模型套件,每个都有一个以地质为主题的代号,可以针对一系列企业任务进行定制。 所有 watsonx.ai 模型均在 IBM 精心策划的、以企业为中心的数据湖上进行训练。
现已上市: 板岩
Slate 指的是一系列仅编码器模型,虽然不是生成式的,但对于许多企业 NLP 任务来说是快速有效的。
即将推出:花岗岩
Granite 模型基于仅解码器、类似 GPT 的生成任务架构。
即将推出:砂岩
砂岩模型使用编码器-解码器架构,非常适合对特定任务进行微调。
即将推出:黑曜石
Obsidian 模型利用 IBM Research 开发的新模块化架构,在各种任务中提供高推理效率和性能水平。
将基础模型与数据存储连接起来,以实现生成式 AI 的成功
如果不能安全地访问值得信赖和特定领域的知识,基础模型的可靠性和对企业人工智能应用程序的益处将大大降低。 幸运的是,数据存储充当安全的数据存储库,并使基础模型能够在规模和训练数据方面进行扩展。
适合以业务为中心的生成式人工智能的数据存储建立在开放的 Lakehouse 架构之上,结合了数据湖和数据仓库的品质。 该架构可以通过低成本对象存储节省成本,并通过 Apache Iceberg 等开放表格式共享大量数据,专为高性能分析和大规模数据处理而构建。
基础模型可以在可扩展、经济高效的容器中查询大量特定于领域的数据。 由于这些类型的数据存储与云相结合,几乎可以实现无限的可扩展性,随着时间的推移,随着更多数据的添加,基础模型的知识差距会缩小甚至消除。 弥补的差距越多,基础模型就越可靠,其范围也越大。
数据存储为数据科学家提供了一个存储库,他们可以使用它来收集和清理用于训练和微调基础模型的数据。 利用第三方提供商的云和混合云基础设施来处理大量数据的数据存储对于生成人工智能的成本效率至关重要。
基础模型和数据存储的商业优势
当基础模型跨数据存储访问信息并微调如何使用这些信息来执行不同的任务并生成响应时,生成的人工智能工具可以帮助组织实现以下优势:
提高效率和生产力
数据科学
数据科学家可以使用预训练模型在一系列关键任务情况下有效部署人工智能工具。
开发者
开发人员可以使用生成自定义代码片段的 AI 工具更快地编写、测试和记录。
内部沟通
高管可以收到人工智能生成的冗长报告摘要,而新员工则可以收到简明版本的入职材料和其他宣传资料。
运营
组织可以使用生成式人工智能工具来自动化执行各种任务,包括:
- 对数据进行分类和分类
- 与客户沟通
- 将消息路由到适当的部门以加快响应时间
- 生成报告
- 预订会议和安排约会
更快的内容生成
营销团队可以使用生成式人工智能工具来帮助创建有关广泛主题的内容。 他们还可以快速准确地将营销材料翻译成多种语言。
更准确的分析
企业领导者和其他利益相关者可以执行人工智能辅助分析来解释大量非结构化数据,使他们更好地了解市场、声誉情绪等。
IBM、基础模型和数据存储
为了帮助组织扩大 AI 对整个业务的影响,IBM 提供了 沃森克斯, 我们的企业级人工智能和数据平台。 该平台包含三个强大的产品:
- watsonx.ai 工作室致力于新的基础模型、生成式 AI 和机器学习
- watsonx.data 适合目的 数据存储,建立在开放的湖屋架构之上
- watsonx.governance 工具包,用于加速以责任、透明度和可解释性构建的 AI 工作流程。