这是商业人工智能激动人心的时刻。 随着我们在从客户服务到人力资源再到代码现代化等领域更广泛地应用该技术, 人工智能 (人工智能)正在帮助越来越多的人更聪明地工作,而不是更努力地工作。 由于我们正处于人工智能商业革命的开端,提高生产力和创造力的潜力是巨大的。
但当今的人工智能是一个极其动态的领域,人工智能平台必须反映这种活力,结合最新的进步来满足当今的需求 和 明天。 这就是为什么我们 IBM 不断添加强大的新功能 IBM沃森克斯,我们的数据和人工智能业务平台。
今天,我们宣布推出最新产品:IBM 构建的新系列 基础模型 这将在 沃森x.ai,我们的生成人工智能、基础模型和机器学习工作室。 这些多尺寸基础模型统称为“Granite” 生成式人工智能 语言和代码。 正如花岗岩是一种坚固的多用途材料,在建筑和制造领域有多种用途,因此 IBM 相信这些 Granite 模型将为您的业务带来持久的价值。
但现在让我们深入了解一下,并解释一下我们是如何构建它们的,以及它们将如何帮助您 将人工智能提升到您业务的新水平。
IBM 的 Granite 基础模型面向商业
由 IBM 研究中心开发,Granite 模型(Granite.13b.instruct 和 Granite.13b.chat)使用“解码器”架构,这是当今大型语言模型预测序列中下一个单词的能力的基础。
对于 130 亿个参数模型,Granite 模型比大型模型更高效,适合单个 V100-32GB GPU。 他们还可以 对环境影响较小 同时在总结、问答和分类等专业业务领域任务上表现良好。 它们广泛适用于各个行业,并支持其他 NLP 任务,例如内容生成、洞察提取和 检索增强生成 (通过将模型链接到外部知识源来提高响应质量的框架)和命名实体识别(识别和提取文本中的关键信息)。
在 IBM,我们专注于构建针对业务的模型。 Granite 系列模型也不例外,因此我们在各种数据集上对它们进行训练(预处理前总计 7 TB,预处理后 2.4 TB),以生成 1 万亿个令牌,即具有以下特征的字符集合: 模型的语义。 我们选择的数据集是针对业务用户的需求,包括来自以下领域的数据:
- 互联网:取自公共互联网的通用非结构化语言数据
- 学术:技术性非结构化语言数据,专注于科学技术
- 代码:涵盖多种编码语言的非结构化代码数据集
- 法律:取自法律意见和其他公开文件的与企业相关的非结构化语言数据
- 财务:取自公开发布的财务文件和报告的与企业相关的非结构化数据
通过在企业专用数据集上训练模型,我们帮助确保我们的模型熟悉这些行业的专业语言和术语,并根据相关行业知识做出决策。
IBM 的 Granite 基础模型专为信任而构建
在商业中,信任是你经营的许可证。 “相信我们”并不是一个争论,尤其是在人工智能方面。 作为最早开发企业人工智能的公司之一,IBM 的人工智能开发方法以 核心原则 植根于信任和透明度的承诺。 IBM 的 watsonx AI 和数据平台让您超越 AI 用户,成为 AI 价值创造者。 它有一个用于构建和测试基础模型和生成人工智能的端到端流程——从数据收集开始,到跟踪模型和应用程序的负责任部署的控制点结束——重点关注治理、风险评估、偏差缓解和合规性。
由于客户可以使用 Granite 模型来适应自己的应用程序,因此培训中使用的每个数据集都经过定义的治理、风险和合规性 (GRC) 审查流程。 我们开发了将数据合并到 IBM Data Pile 中的治理程序,这些程序符合 IBM AI 道德原则。 解决数据的 GRC 标准涉及训练数据的整个生命周期。 我们的目标是建立一个从经过训练的基础模型一直到训练模型的特定数据集版本的可审计链接。
许多媒体的注意力(正确地)集中在生成式人工智能产生仇恨或诽谤性输出的风险上。 在 IBM,我们知道企业承担不起这样的风险,因此我们的 Granite 模型是根据我们自己的“HAP 检测器”审查的数据进行训练的,这是一种由 IBM 训练的语言模型,用于检测和根除仇恨和亵渎内容(因此“ HAP”),它以内部和公共模型为基准。 为文档中的每个句子分配分数后,将对句子和分数进行分析以探索分布,从而确定要过滤的句子的百分比。
除此之外,我们还采用广泛的其他质量措施。 我们搜索并删除重复内容以提高输出质量,并使用文档质量过滤器进一步删除不适合训练的低质量文档。 我们还部署定期、持续的数据保护措施,包括监控以盗版材料或发布其他攻击性材料而闻名的网站,并避开这些网站。
由于生成式人工智能技术格局在不断变化,我们的端到端流程将不断发展和改进,为企业提供值得信赖的结果。
IBM 的 Granite 基础模型旨在为您提供支持
IBM 商业人工智能愿景的关键是赋权概念。 每个组织都会部署 Granite 模型来实现自己的目标,每个企业都有自己的法规需要遵守,无论它们来自法律、社会规范、行业标准、市场需求还是架构要求。 我们认为企业应该有权根据自己的价值观(在一定限度内)个性化他们的模型, 无论他们的工作负载位于何处,使用watsonx平台中的工具。
但这还不是全部。 无论您在 watsonx 中做什么,您都保留数据的所有权。 我们不会使用您的数据来训练我们的模型; 您保留对所构建模型的控制权,并且可以将它们带到任何地方。
花岗岩基础模型:仅仅是开始
最初的 Granite 模型只是一个开始:计划使用其他语言提供更多模型,并且正在准备更多 IBM 训练的模型。 同时我们继续向 watsonx 添加开源模型。 我们 最近宣布 IBM 目前正在向选定的客户提供 Meta 的 Llama 2-chat 700 亿参数模型以供早期访问,并计划在 9 月晚些时候广泛提供。 此外,IBM 将托管 StarCoder,这是一个大型代码语言模型,包括 80 多种编程语言、Git 提交、GitHub 问题和 Jupyter Notebook。
除了新模型之外,IBM 还在 watsonx.ai 工作室中推出新的补充功能。 本月晚些时候,我们的 Tuning Studio 的第一次迭代即将推出,其中将包括 及时调整,这是一种高效、低成本的方式,让客户通过自己的可信数据训练模型,使基础模型适应其独特的下游任务。 我们还将推出合成数据生成器,它将帮助用户从自定义数据模式或内部数据集创建人工表格数据集。 该功能将使用户能够提取人工智能模型训练和微调或场景模拟的见解,降低风险,增强决策能力并加快上市时间。
将 Granite 基础模型和其他功能添加到 watsonx 中,为商业人工智能开辟了令人兴奋的新可能性。 新模型和新工具带来新想法和新解决方案。 其中最好的部分是什么? 我们才刚刚开始。
通过我们的 watsonx 试用体验来测试 watsonx.ai
有关 IBM 未来方向和意图的声明如有更改或撤销,恕不另行通知 仅代表目的和目标。