IBM 今天宣布推出 IBM watsonx.data,一个建立在开放式 Lakehouse 架构上的数据存储,可帮助企业轻松统一和管理其结构化和非结构化数据,无论其位于何处,以实现高性能 人工智能 和分析。 该解决方案目前处于内测阶段,预计将于 2023 年 7 月全面上市。
什么是 watsonx.data?
Watsonx.data 将成为 IBM 新的人工智能和数据平台 IBM watsonx 的核心, 今天在 IBM Think 上宣布. 借助 watsonx,IBM 将推出一个集中式 AI 开发工作室,让企业可以访问专有的 IBM 和开源基础模型、用于收集和清理数据的 watsonx.data,以及用于 AI 治理的工具包。
Watsonx.data 将允许用户通过单一入口点访问他们的数据,并在 IT 环境中运行多个适合用途的查询引擎。 通过工作负载优化,组织可以通过增加此解决方案将数据仓库成本降低多达 50%。[1] 它还提供内置治理、自动化以及与组织现有数据库和工具的集成,以简化设置和用户体验。
支持数据管理生命周期
根据 IDC 的 Global StorageSphere,存储在数据中心的企业数据将在 2021-2026 年间以 30% 的复合年增长率增长。[2] 随着数据量的增加,数据孤岛、运营成本和监管压力也随之增加,这可能导致更严格的审查和对数据、分析和人工智能投资改善业务成果的需求。
数据的激增遍及每个行业,组织有机会将其转化为可操作的见解,为收入战略提供信息并提高运营效率。
“媒体和娱乐行业经历了重大的数字化转型,观众在不同的设备和平台上消费内容,”AMC Networks 商业智能执行副总裁 Vitaly Tsivin 说。 “Watsonx.data 可以让我们轻松访问和分析我们广泛的分布式数据,以帮助提取可操作的见解并最大限度地利用我们的资源,从而为 AMC Networks 精心策划的高质量内容的观众提供卓越的用户体验。”
值得注意的是,watsonx.data 在本地和跨多云环境中运行。 该解决方案将帮助企业利用日益孤立的数据并应用先进的人工智能和分析来获得可操作的见解,同时在整个过程中支持强大的数据治理和可观察性 数据管理生命周期.
强大的合作伙伴关系以获得更强大的解决方案
Watsonx.data 旨在使用英特尔新的第 4 代 Xeon 可扩展处理器和开源查询引擎(如 Presto、Velox 加速库和 Spark)上的英特尔内置加速器,为高性能 SQL 查询提供快速可靠的数据处理,报告、商业智能和机器学习。
“我们认识到 watsonx.data 的重要性以及它所基于的开源组件的开发,”英特尔云和企业解决方案事业部副总裁兼高级首席工程师 Das Kamhout 说。 “我们期待与 IBM 合作优化 watsonx.data 堆栈,通过我们对 Presto 开源社区的联合技术贡献实现突破性的性能。”
IBM 和英特尔在数据和 AI 产品方面有着悠久的合作历史,包括在 Intel Xeon 平台上优化 IBM Db2、使用 IBM Watson NLP Library for Embed with OneAPI 进行 AI 加速,以及现在的 watsonx.data。
Watsonx.data 将允许用户使用类似数据仓库的功能对其数据存储库进行现代化改造,同时受益于低成本的对象存储以及 Iceberg 等开放数据和表格格式,帮助他们在几分钟内做出数据驱动的决策。
Cloudera 产品管理执行副总裁 Paul Codding 表示:“由 Apache Iceberg 表格式提供支持的开放式数据湖屋架构使组织能够灵活地使用适合用途的分析解决方案来为所有工作负载提供面向未来的数据平台。” “IBM 和 Cloudera 客户将受益于一个真正开放且可互操作的混合数据平台,该平台推动并加速人工智能在不断增加的用例和业务流程范围内的采用。”
IBM 和 Cloudera 建立了长期的战略合作伙伴关系,包括经过认证的产品集成以及联合销售和支持模型。
Wasonx.data 将在本地和多个云提供商之间提供,包括 IBM Cloud 和 Amazon Web Services (AWS)。 这是建立在去年 IBM 宣布扩大与 AWS 的关系以在 AWS 上提供 IBM 软件即服务的基础上的。 该解决方案还将在 AWS Marketplace 中提供。
AWS 全球战略联盟总监 Soo Lee 表示:“组织越来越多地采用 Data Lakehouse 解决方案来支持他们不断增长的数据需求,尤其是当我们看到整个行业正在转向 AI 解决方案时。” “让 watsonx.data 在 AWS Marketplace 中作为一项服务提供,进一步满足了我们客户对混合云日益增长的需求——使他们能够更灵活地随时随地运行业务流程,同时提供广泛的 AWS 服务和 IBM 云原生选择满足他们独特需求的软件。”
Watsonx.data 将扩大 IBM 在数据和人工智能领域的市场领导地位, 最近证明 被其评价为T中的领导者Forrester Wave:分析数据管理,通过与 StepZen、Databand.ai、IBM Watson Knowledge Catalog、IBM zSystems、IBM Watson Studio 和 IBM Cognos Analytics with Watson 等现有 IBM 解决方案集成。 这些集成使 watsonx.data 用户能够在其数据生态系统中实施各种行业领先的数据目录、沿袭、治理和可观察性解决方案。
除了发布之外,watsonx.data 预计将进行持续开发,通过 Velox 以及 IBM 最近收购 Ahana,将最新的性能增强整合到 Presto 开源查询引擎中,Ahana 是 Presto 的唯一 SaaS,也是 Presto 开源的强大贡献者。源社区。 watsonx.data 的进一步开发还将结合 IBM 的 Storage Fusion 技术,以增强跨远程源的数据缓存,以及基于 IBM Research 基础模型构建的语义自动化功能,以通过对话式用户体验实现数据发现、探索和丰富的自动化。
有关 IBM 未来方向和意图的声明如有更改或撤销,恕不另行通知,并且仅代表目的和目标。
[1] 比较针对 watsonx.data 的 VPC 小时标准化的 2023 年公布标价与几家主要云数据仓库供应商。 节省的费用可能因配置、工作负载和供应商而异。
[2] IDC,全球 Global StorageSphere 预测,2022 年至 2026 年:2021 年 7.9ZB 存储容量的安装基础需要 3700 亿美元的成本——够了吗? (IDC 文件 #US49051122,2022 年 5 月)