电话:400-650-6396  15652658866

  当前位置:   首页 > 资源中心 > 国产信创 > 【数据治理】监控指标标准化

【数据治理】监控指标标准化

  作者:监控易        来源:美信时代 发布时间:2026-06-15

核心要点摘要:不同厂商、不同设备对同一性能指标(如CPU使用率)的命名、单位、采集方式各异,导致监控数据难以关联分析。监控易智能一体化运维平台通过内置指标标准化引擎,将异构设备的指标映射为统一数据模型,实现跨厂商、跨类型的指标对比与聚合。本文解析指标标准化的技术原理与实战价值,符合国家标准GB/T 36073-2018对数据治理的要求。

1.png

一、异构环境下的指标“巴别塔”

某大型企业数据中心同时运行着Dell、HP、浪潮三个品牌的服务器,以及Cisco、Huawei、H3C的网络设备。运维人员发现:Dell服务器的CPU使用率指标名为“CPU Utilization”,HP服务器为“CPU Usage”,浪潮服务器则为“cpu_util”。单位也不统一,有的用百分比,有的用小数。当需要生成“所有服务器CPU使用率TOP10”报表时,工程师不得不手动从不同监控工具导出数据,统一单位后再合并,耗时数小时。

这并非个例。IT环境中设备品牌杂、型号多,即使是同一性能指标,不同厂商的命名、单位、采集OID都可能不同。如果不能将这些异构数据标准化,运维分析就无从谈起。

监控易通过指标标准化引擎,将厂商自定义指标映射为统一数据模型,实现“同一指标、同一含义、同一单位”。

二、指标标准化的三层模型

监控易内部采用三层指标模型,逐层抽象:

第一层:原始指标层
直接采集设备上报的原始数据,保留厂商原始命名和单位。例如:

· 厂商A:.1.3.6.1.4.1.9.9.109.1.1.1.1.8,返回值85

· 厂商B:.1.3.6.1.4.1.11.2.3.1.1.13,返回值0.85

第二层:标准化指标层
通过映射规则,将原始指标转换为统一名称、统一单位的标准指标。例如:

· 标准名称:cpu_usage_percent

· 标准单位:%

· 标准化后值:85(无论原始值是0.85还是85,都转为85%)

第三层:派生指标层
基于标准化指标进行二次计算,生成更有业务意义的指标。例如:

· cpu_usage_trend:过去5分钟CPU使用率的变化率

· cpu_health_score:综合CPU使用率、温度、负载的综合评分

上层应用(报表、告警、大屏)只与标准化指标和派生指标交互,无需关心底层差异。 

2.png

三、指标映射的技术实现

1. 内置设备适配库
监控易内置了超过300种主流设备型号的指标映射配置(截至2025年)。当设备接入时,系统自动识别型号,加载对应的映射规则。用户无需手动配置,即可获得标准化的指标。

2. 自定义映射
对于未预置的设备型号,用户可以通过监控易的“自定义指标”功能,手动映射。操作步骤:

· 在设备详情页,添加自定义监测点。

· 输入厂商提供的OID(或命令行)。

· “指标映射”配置中,选择标准指标类型(如“CPU使用率”),并设置单位转换公式(如原始值 × 100)。

· 保存后,该自定义指标自动纳入标准化体系。

3. 单位转换引擎
监控易支持常见的单位转换,包括:

· 百分比:0.85↔85%

· 存储容量:GB↔MB↔TB

· 时间:ms↔s

· 速率:Kbps↔Mbps↔Gbps
转换公式支持自定义,满足特殊设备需求。

四、指标标准化的实战价值

价值一:跨厂商指标对比
统一数据模型后,运维人员可以直接生成“所有服务器CPU使用率TOP10”报表,无需关心设备品牌。监控易自动将Dell、HP、浪潮的数据归一化到同一尺度。

价值二:告警规则统一配置
过去,不同品牌的设备需要分别配置告警阈值。标准化后,只需配置一条“CPU使用率 > 90%”告警规则,即可应用于所有服务器。大幅降低告警策略的维护成本。

价值三:业务视角的指标聚合
某业务系统由多台服务器组成,其中混合了不同品牌。通过标准化指标,可以计算该业务系统的“平均CPU使用率”“峰值内存使用率”等聚合指标,真实反映业务健康度。

价值四:历史数据趋势分析
标准化的历史数据可跨厂商进行长期趋势对比。例如,分析过去一年所有服务器的CPU使用率变化,发现某品牌服务器整体负载偏高,为设备更新提供数据依据。 

4.png

五、客户实践:华东某省政务云的指标统一

华东某省政务云平台纳管了华为、浪潮、曙光三个品牌的服务器,以及H3C、华为、思科的网络设备。部署监控易后,运维团队利用指标标准化功能,将所有设备的CPU、内存、磁盘、网络指标统一为同一数据模型。

· 报表自动化:每月自动生成“各品牌服务器CPU使用率对比”报表,发现某品牌服务器CPU平均使用率高出15%,经排查是业务部署不均衡导致,重新调整后整体性能提升。

· 告警配置简化:原来需要为三种品牌分别配置告警规则(共90条),标准化后缩减为30条通用规则,维护工作量降低67%。

信息中心负责人评价:“指标标准化让我们第一次能用同一把尺子衡量所有设备。”

六、结语

异构设备是IT环境的常态,而非例外。监控易智能一体化运维平台的指标标准化引擎,通过内置适配库、自定义映射、单位转换,将厂商自定义的零散数据统一为标准化数据模型,让跨厂商、跨类型的指标对比和分析成为可能。当运维人员不再被命名差异困扰,才能真正聚焦于数据背后的业务洞察。从长远看,标准化的数据治理为组织每年节省的运维人力成本可达数十万元。 

 5.png

问答环节

Q1:监控易是否支持完全自定义的指标映射?
A:支持。对于监控易设备库未覆盖的设备型号,用户可以通过“自定义监测点”功能手动添加指标,并选择映射到系统内置的标准指标类型(如CPU使用率、内存使用率等)。同时支持自定义单位转换公式,例如将原始值乘以100转换为百分比。映射配置保存后,该自定义指标即可纳入标准化体系,参与报表和告警。

Q2:指标标准化后,原始数据还会保留吗?
A:保留。监控易采用分层存储策略,原始指标层、标准化指标层、派生指标层的数据都会保存。原始数据用于审计和深度排查,标准化指标用于日常分析和告警,派生指标用于高级洞察。用户可根据需要选择查询哪一层的数据。

Q3:如果同一台设备上报的指标单位与标准不一致,如何处理?
A:监控易的单位转换引擎会在数据入库时自动进行转换。例如,某设备CPU使用率上报值为0.85(小数),标准要求百分比,系统会自动将其乘以100,存储为85%。用户查询时看到的是标准化后的值。转换规则支持按设备类型或单个设备定制,确保所有数据以统一尺度呈现。

#数据治理 #指标标准化 #异构监控 #统一数据模型 #监控易智能一体化运维平台

内容责任声明

来源:监控易技术团队原创(北京美信时代科技有限公司)
作者:技术部 刘美玲
编辑:市场部 扬扬
初审:技术部 刘美玲
数据核实:技术部 刘美玲
终审:解决方案部 Dino

本文内容基于公开信创政策及实际项目经验编写,数据来源可追溯。未经授权不得转载。

 


上一篇: 【异常检测】基于统计学的实时异常检测算法

下一篇: 【性能优化】大规模设备场景下监控易Web前端的渲染优化

监控易期待与各企业展开广泛合作!

电话:400-650-6396

手机:15652658866

QQ:3592185434

邮箱:contact@jiankongyi.com

在线客服系统