在我们之前的博客中,我们确定了网络数据货币化的三个层次. 它们是数据层、分析层和自动化层。 为成功解决网络数据价值树问题,我们必须解决这三层的复杂性,这对于电信公司的自动化运营至关重要。 在下一部分中,我们将讨论每一层的复杂性。
三层复杂性
回顾一下,我们确定了实现自动化操作的三个复杂层次:
- 数据层: 收集数据并使所有感兴趣的消费者都可以访问和理解这些数据
- 分析层: 分析各种用例的数据以提供可操作的见解
- 自动化层: 以自动化方式根据可行的见解采取行动
数据层背后的主要思想是 数据民主化. 数据民主化基于两个概念。 首先,收集的数据永远不应被收集数据的实体所垄断。 其次,CSP 组织中的每个人都必须能够利用数据,无论他们的技术知识如何(当然前提是数据访问策略允许访问)。 分析层位于数据层之上。 它最初是一个空的但可插入的层,具有管理功能,可以 主机分析功能 作为数据消费者和可操作见解的提供者。 最后,顶层是自动化层。 它承载各种功能 消费可操作的见解 从分析层到自动化网络中的操作和优化过程。
网络数据层的关键复杂性:
- 数据的完整性 – 一些网络产生如此多的数据,以至于在经典系统中,出于实际原因,许多数据常常被忽略。 在故障管理领域可以找到一个例子:如果重点是重大和关键事件,警告和信息事件可能不会被存储,而这些对于重大和关键事件的预测非常有用。
- 数据的含义 – 网络数据比信用卡数据等抽象得多。 网络产生的数据点的命名不一定直观清楚。 通常有几个数据点共同描述特定的网络行为。 例如,在无线电接入网络中,有关无线电接入承载设置过程的详细信息是通过数十个不同的参数来传递的。 这通常需要建立数据目录等资产来帮助数据解释。 最后,了解数据的含义是了解与观察到的用例相关的所有数据是否可用的第一步。
- 数据量 – 网络实体产生大量数据,收集这些数据时需要巨大的存储容量,从而导致能源消耗增加。 同时,有价值用例的数据使用很少,因为并非所有收集的数据都被分析模块使用。 因此,只需要收集消耗的数据。 否则,数据层会在收集和存储未使用的数据上浪费能源,这会引发严重的环境问题。
- 速度 的数据 – 收集间隔需要非常短以满足用例的实时要求。 事实上,现代最先进网络的标准建议近实时用例的收集间隔为 10 毫秒。 鉴于传统网络中典型的收集周期为 15 分钟(900.000 毫秒),数据收集速度必须提高 90.000 倍。 并且数据量增加了相同的因素。
- 各种数据 – 在真实网络中收集了数百万个独特的 KPI,因为每个网络元素都会产生许多数据点。 此外,运营商通常拥有来自多个供应商的网络设备,每个供应商都使用自己的命名法和格式发布其数据点,这需要保持一致。 挑战在于整合这些差异,这样数据分析师就不必成为每个供应商细节方面的专家。
- 选择使用数据 – 一些网络元素产生 10.000 个独特的 KPI,挑战在于确定哪些可以在用例中增加价值。
分析层的关键复杂性:
- 复杂 – 分析用例从简单的 KPI 聚合或基于阈值的分析到预测数据点未来值的基于 AI/ML 的高级算法不等。 需要预测能力来提高所提供服务的质量并实现主动操作,这对于实现现代服务的严格 SLA(例如超低延迟或增强型移动宽带)至关重要。
- 延迟要求 – 分析用例具有各种延迟要求,这进一步对其物理位置提出了要求——有些可以在中央网络位置运行,而有些则需要极端的数据接近度才能近乎实时地分析数据。
- 分析模块的链接 – 来自一个分析模块的见解可以触发另一个模块。 这些见解必须加盖戳记并参考 UTC,以便在使用时可以区分它们。
- 来自不同网络元素的数据点的相关性 – 网元一起提供服务,因此需要一起分析来自它们的数据点。
自动化层的关键复杂性:
- 自动对可操作的见解做出反应 – 来自分析层的可操作见解不是很有用,除非我们对它们做出自动化反应。 然而,这里的主要问题是如何确保自动响应与运营商的运营目标保持一致。 为此,必须定义一组全局策略来管理自动响应的生成和执行。
- 冲突检测和解决 – 分析模块实际上可能会发送相互矛盾的见解和对见解的相互矛盾的自动反应。 这强加了策略冲突管理的存在,它可以检测冲突并解决它们,这样运营商的全局策略就不会被违反。 例如,节能自动化操作可能与用于改善退化服务性能的自动化操作相冲突。 在这种情况下,必须优先考虑并批准后一个动作,而必须拒绝前一个动作。
基础和理想用例示例
以下是基本用例的一些常见示例:
- 网络运营中心 (NOC) 的自动根本原因分析
- 无线电接入网络中的节能
- 预测网络中断以最大限度地减少对客户的影响
- 分析网络中的呼叫掉线以找出其根本原因
- 分析跨域影响(核心、传输、接入域)
虽然这些用例的需求很常见,但实施可能具有挑战性。
- 示例 1:光纤切断会导致数百(如果不是数千)事件,而光纤本身是无源元件,不会提供任何事件。 断纤事件类别可以很容易地通过类似事件的突然泛滥来识别,但是断纤位置的确定更加复杂,可能需要额外的网络拓扑信息(数据的完整性).
- 示例 2:15 分钟的间隔可能不够精细,无法准确检测异常,并且由于系统限制,可能无法实现更精细的收集间隔(数据的速度).
- 示例 3:Syslog 数据通常非常庞大,而这些消息中包含的信息非常晦涩难懂(数据量 和 数据的含义).
理想用例的示例:
- 分析看似无关的领域之间的潜在关联
- 中断前的流量模式分析
- 分析潜在的流量重新分配可能性以优化资源利用
- 分析用户和流量动态的变化如何影响网络履行用户 SLA 的能力
如何交付成功的网络分析项目
要交付成功的网络分析项目,重要的是要关注您想要推动的价值,同时不要忘记基本的推动因素。
由于数据科学家难以访问和理解网络数据,许多网络分析项目都陷入困境。 一旦数据问题得到解决,可能缺乏自动化功能可能会阻止所获得的洞察力的货币化。
一个好的起点是全面的网络数据评估,涵盖所有三个层面:
- 网络数据的可访问性如何?
- 网络数据的用途是什么,还有哪些其他用途没有被利用?
- 网络域外的人对网络数据的理解程度如何?
- 哪些类型的分析应用于网络数据以获得对您的组织有价值的见解(并且可以据以采取行动)?
- 这些可行的见解做了什么? 相关的自动化水平是多少?
用于此评估的 IBM 方法与供应商无关; 这意味着我们可以使用 IBM 技术组件,以及来自其他供应商和超大规模应用程序的技术组件。
这 IBM 车库 方法可以帮助您优化当前能力的价值。 我们可以与您的利益相关者一起帮助您创建网络数据价值树并制定路线图以从您的网络数据中获取更多价值,同时解决三层(数据、分析和自动化)中每一层的复杂性增量方式。
想了解更多? 联系我们 Maja.Curic@ibm.com 和 chris.van.maastricht@nl.ibm.com.