Google Cloud Platform (GCP) 使客户能够构建、管理和部署现代化、可扩展的应用程序,以实现数字业务的成功。 然而,由于其复杂性,实现 卓越运营 在云中是困难的。 从根本上说,作为云运营商,您需要在预算范围内确保出色的最终用户体验。
在这篇博文中,我们将回顾 GCP 云成本管理的各种方法、它们解决的问题以及 GCP 用户如何最好地使用它们。 然而,无论您的云成本优化策略如何,实现卓越运营 大规模 并利用 云的弹性 需要能够同时优化您的消费以提高性能和成本的软件,并使您能够轻松、安全、自信地实现自动化。 让我们回顾一下 IBM Turbonomic 如何帮助客户优化他们的 GCP 云成本。
适当大小的实例
Google Cloud Platform 的运营费用模型 (OPEX) 会根据不同资源的可用容量向客户收费,无论这些资源是否得到充分利用。 GCP 用户可以购买不同类型和大小的实例,但通常会购买可用的最大实例以确保性能。 合理调整资源大小是将实例类型和大小与工作负载性能和容量要求相匹配的过程。 要以最低成本运营,必须持续调整资源规模。 然而,云运营商通常会反应性地调整规模——例如,在执行“升降机” 云迁移或开发。
Migrate for Compute Engine 是一款 GCP 工具,具有大小合适的功能,可推荐实例类型以优化成本和性能。 此工具提供两种类型的正确规模建议。 第一个是基于性能的建议,这些建议基于当前分配给本地的 CPU 和 RAM 虚拟机 (VM). 第二种是基于成本的建议,它基于本地 VM 的当前 CPU 和 RAM 配置以及给定时间段内 VM 的平均使用率。
如何使用 IBM Turbonomic 调整实例大小
让我们回顾一下 IBM Turbonomic GCP 用户如何通过基于百分位数的扩展来调整实例大小。 下图表示 IBM Turbonomic UI。 图1 显示应用程序堆栈。 左侧的供应链表示 Turbonomic 从业务应用程序向下映射到云区域的资源关系。 它可以包括其他组件,如容器 Pod、存储卷、虚拟机等,具体取决于支持应用程序的基础架构。
这种对全栈的理解使 Turbonomic 的建议值得信赖,并使云工程和运营有信心实现自动化。 对于这个 GCP 账户,Turbonomic 已经确定了 15 个待处理的扩展操作:
选择后 显示所有客户被带到 Turbonomic 的行动中心,可以在 图 2, 以下。 此图显示了可用于此 GCP 帐户的所有缩放操作。 通过查看此仪表板,客户可以找到相关信息,例如账户名称、实例类型、折扣范围和按需成本。 客户可以选择不同的操作并通过单击执行它们 执行动作 在右上角:
对于寻找有关特定操作的更多详细信息的客户,他们可以选择 细节 Turbonomic 将提供其在建议中考虑的其他信息。 如下图所示 图 3,此实例需要缩减,因为它有未充分利用的 vCPU。 此操作的其他信息包括执行操作的成本影响、由此产生的 CPU 利用率和容量以及净吞吐量:
缩放实例
公共云环境总是在变化,为了实现性能和预算目标,谷歌云平台 (GCP) 用户必须在垂直方向(适当调整/向上扩展)和水平方向(向外扩展)扩展他们的实例。 为了横向扩展,GCP 客户可以观察应用程序负载平衡,然后随着需求增加导致负载增加而扩展实例。 通过水平扩展在多个实例之间分配负载可以提高性能和可靠性,但实例必须随着需求的变化而缩减,以避免产生不必要的成本。
Compute Engine 还通过根据负载的增加或减少自动添加或删除 VM 实例,为 GCP 客户提供自动缩放功能。 但是,此工具在用户定义策略的约束下进行扩展,并且仅适用于称为托管实例组 (MIG) 的指定 VM 实例。
优化水平缩放的唯一方法是通过自动化实时进行。 IBM Turbonomic 持续生成扩展操作,因此应用程序始终可以以最低成本执行。 图 4 下面代表一个需要扩容的 GCP 帐户:
此 GCP 帐户的水平缩放操作可以在操作中心下的 提供操作 子类别发现于 图 5 以下。 在这里,您可以找到有关操作和相应工作负载的信息,例如容器集群、命名空间和对工作负载构成的风险(在本例中为事务拥塞):
在 图 6 下面,您可以看到 Turbonomic 如何提供采取行动背后的理由。 在这种情况下,虚拟机遇到 vCPU 拥塞,需要配置额外的 CPU 以提高性能。 Turbonomic 还指定了所有详细信息,包括姓名、ID、帐户和年龄:
暂停实例
优化 GCP 云支出的另一个重要方法是关闭空闲实例。 如果组织当前未使用实例(例如在非营业时间)但希望在短期内恢复使用,则可以暂停实例。 删除实例时,实例将关闭,永久磁盘上存储的所有数据也将被删除。
但是,在暂停实例时,客户不会删除附加的永久性磁盘中包含的底层数据。 再次启动实例时,永久磁盘会简单地附加到新配置的实例上。 GCP 用户还可以使用 Compute Engine 暂停实例。 GCP 客户无法暂停使用 GPU 的实例,必须通过 Google Cloud 控制台手动执行暂停。
IBM Turbonomic 自动识别并提供暂停实例的建议。 要使用 Turbonomic 暂停实例,客户需要首先选择一个具有待定暂停操作的 GCP 帐户,如中所示 图 7 以下:
要执行暂停操作,Turbonomic 客户需要前往操作中心,选择相应的操作并执行。 在下面 暂停操作 操作中心的选项卡,如中所示 图 8,客户可以看到每个实例的 Vmem、VCPU 和 Vstorage 容量,并带有待处理的操作:
如果客户在执行前需要更多详细信息,他们可以选择 细节,如图所示 图 9 以下. 为该操作提供的详细信息包括操作背后的原因(在本例中是为了提高基础设施效率)和成本影响、实例的年龄、虚拟 CPU 和内存,以及该实例的消费者数量:
利用折扣价
客户还可以通过优化承诺使用折扣 (CUD) 的覆盖范围和利用率来利用折扣定价来降低成本。 GCP Compute Engine 允许客户购买和续订基于资源的承诺使用合同或承诺,以换取 VM 使用的大幅折扣价。 GCP 用户可以利用 Compute Engine 通过分析客户的 VM 使用模式生成的承诺使用折扣建议。
IBM Turbonomic 的分析引擎自动提取并显示与 GCP 协商的费率,然后生成特定的承诺使用折扣缩放操作,以便客户可以最大限度地扩大 CUD 到实例的覆盖范围。 图 10 代表一个 GCP 账户,该账户有 15 个待处理的操作来增加 CUD 利用率和覆盖范围:
图 11 表示可以在操作中心执行以增加 CUD 覆盖范围的缩放操作。 此处操作中心列出的一些重要详细信息是生成的实例类型、百分比折扣范围和采取扩展操作的按需成本。
图 12 提供此操作的更多详细信息,例如 vCPU 和 vMem 利用率、吞吐量容量和利用率以及总节省量。 所有这些信息都可以再次在相应的操作中找到 细节 标签:
删除未附加的资源
最后,如前所述,Google Cloud Platform 的运营费用模型 (OPEX) 不仅针对正在使用的资源向客户收费,还针对整个可用资源池收费。 随着组织构建新版本并将其部署到他们的环境中,一些资源未被附加。 未附加资源是指客户创建资源但完全停止使用它。
开发后,可以保留数百种不同的资源类型。 删除未附加的资源可以显着减少浪费的云支出。 图 13 下面显示了一个 GCP 帐户,该帐户已识别出五个可以删除的未附加资源。 与暂停空闲实例一样,GCP 用户可以利用 Compute Engine 手动删除未使用的实例:
此帐户的删除操作在操作中心中列出 图 14。 操作中心的删除类别中列出的信息包括永久磁盘的大小、存储层、未连接的时间以及删除它的成本影响:
要进一步了解这些删除操作的影响,客户可以选择 细节 选项卡并找到更多信息,如图所示 图 15. 在下面,您可以看到此操作的目的是增加储蓄。 客户还可以查看其他信息,例如卷详细信息、操作是否具有破坏性以及资源和成本影响:
IBM Turbonomic 值得信赖的自动化是在 Google Cloud Platform 上实现业务价值最大化的最佳方式
对于希望在不对客户体验产生负面影响的情况下实现预算目标的云工程和运营团队, IBM 涡轮经济 提供您可以信赖的行之有效的途径。 只有 Turbonomic 可以分析您的 Google Cloud Platform (GCP) 环境,并持续将实时应用程序需求与 Google Cloud 在计算、存储、数据库和折扣定价方面空前数量的配置选项相匹配。
您是否希望尽快减少整个 GCP 环境的支出? IBM Turbonomic 的自动化可以实施,使团队能够立即和持续地看到切实的结果,同时在不到六个月的时间内实现 471% 的投资回报率。 阅读 Forrester Consulting 委托进行的研究 了解我们的客户使用 IBM Turbonomic 取得了哪些成果。
详细了解 IBM Turbonomic 如何支持您的特定用例并申请演示。