凯时AG新闻中心
稳保行动 中国信通院2025年“可凯时AG,信云·系统稳定性保障评估”开启报名通道
保障系统稳定性是现代软件开发中最具挑战性的问题之一,也是确保业务连续运行的重要因素。大型云平台、应用平台、智算服务和重要IT系统的稳定安全运行,是我国信息通信行业高质量发展的基石,也是我国数字经济快速发展的必要条件,针对系统稳定安全运行的技术研究和实践推广具有重要意义。
中国信通院自2020年起开展系统稳定性保障技术研究,2021年牵头成立稳定性保障实验室(原混沌工程实验室),以稳定性保障实验室为依托,在2024年结合稳定性领域发展现状,结合AI,大模型等新兴技术,为保障企业系统稳定性、提升服务连续性、促进业务高质量发展,中国信通院更新并构建了包括AI云运行安全、运行安全建设水平、运行安全技术能力及可信云服务稳定性专项评估的稳定性保障标准体系(以下简称“稳保体系”),为我国系统稳定性保障能力建设起到了重要推动作用。迄今已有超百款产品参与“稳保体系”能力评估,相关工作得到业内积极反馈和广泛认可,成为行业规范、用户选型的重要参考。2025年“可信云·系统稳定性保障评估”报名通道正式开启,欢迎各界广泛参与!
证券、银行、金融行业共有 22 家企业 37 个项目参与 稳保体系标准评估
为了推动基于人工智能的运维技术的发展和规范化,中国信通院联合中移苏研、华为云、四川农商银行、京东、嘉为、蚂蚁、腾讯、浪潮、小米等数十家头部企业专家,依托稳定性保障实验室,共同研讨并制定了《基于人工智能的云计算运维能力成熟度模型》标准体系。该标准体系通过详细的指标项,为产品建设方提供了参考标准,为人工智能的创新发展提供了有力支持凯时AG,。
《基于人工智能的云计算运维能力成熟度模型》包括知识数据层、智能算法层、工程能力层和运维场景层四大能力层及18项二级能力项。以完善的运维知识数据支撑运维智能算法和模型的训练、评估、推理、微调和安全防护,基于算法和模型构建运维智能化工程能力并运用于运维工作的各个场景。
适用于各云服务建设方的智能运维能力评估,同时适用于运维智能体、运维大模型、智能运维应用等服务提供商的智能运维解决方案。
基于大模型的运维能力成熟度模型要求由低到高划分为5个等级,即基础使用级(L1)、技术赋能级(L2)、场景辅助级(L3)、智能体引导级(L4)、自主决策演化级(L5)。
2023年10月,工信部等六部门联合印发《算力基础设施高质量发展行动计划》,信通院立即组织召开算力稳定性系列标准研讨会,历时1年,召开7轮公开研讨会,对十余家企业进行调研,最终编制完成《面向大规模智算服务集群的稳定运行能力要求》。
适用于万卡/千卡智算集群/平台/解决方案、大模型训练推理平台,以及各类AI Infra平台/解决方案。
标准从万卡/千卡集群、大模型训练推理平台交付前期的规划建设、生产准备、稳定运行阶段的全生命周期模型能力进行规范。
可选取6大能力域的1项或多项进行评估,分别进行等级划分,等级由低到高为三星级、四星级、五星级,同时,评估证书将注明目标智算服务集群的规模级别(百卡级/千卡级/万卡级)。
随着云计算与微服务技术的深入融合,IT运维环境的复杂性显著增加,各类服务的拓扑结构日益复杂、动态性增强,以及依赖关系的交织。观测数据与对象的规模相较传统环境扩大了数十倍,跨部门协同难度加剧。这些挑战使得可观测性建设变得更加困难。大模型等智能化技术能够自动化分析海量数据,快速发现并解决问题,成为应对云计算可观测性难题的关键工具。在此背景下,中国信通院联合国内头部云厂商、观测厂商及各行业建设方,历时近5个月,共同编制了《云计算智能化可观测性能力成熟度模型》,以规范和指导云计算环境下的智能可观测性建设实践,为企业实施云环境下的智能化可观测能力建设提供指导。
适用于可观测大模型、可观测智能体、云厂商可观测性平台、可观测独立厂商的各类产品、可观测建设方案等。
标准涵盖可观测能力及智能化能力的成熟度模型构建,从全生命周期规范可观测平台的建设和运维,前瞻性提出智能化可观测性的能力建设指引。
运行安全建设水平聚焦建设成效,涉及一云多芯稳定性、服务韧性工程(SRE)、算力稳定安全运行、证券期货行业重要系统稳定性、金融业务连续性、金融分布式系统风险管理、通信行业稳定性保障的建设水平。此些评估体系提供了梯度建设成效模型,指导企业逐步推进建设稳定性能力建设,技管结合,全方位度量/指导稳定性建设成效、针对性提升稳定性建设短板。
随着我国广泛于互联网、金融、制造业、政府服务等领域持续推进数字化转型。云计算已逐渐成为数字化建设的核心基础设施。云平台凭借其灵活性、可扩展性和高效性,在各行各业得到了广泛应用。为了保障云平台运行更加安全稳定,服务韧性工程(SRE)系统架构通过强调可靠性、自动化运维、快速故障恢复、弹性扩展、持续改进以及业务与技术的紧密结合,提高系统的稳定性、可维护性和灵活性。
为了能够支撑服务韧性工程(SRE)的技术发展和能力规范,推动相关技术和产品在业界的普及实施,。中国信通院依托稳定性保障实验室联合数十家头部企业专家联合研讨并输出《服务韧性工程(SRE)能力要求》标准体系。通过建立详细的指标项,编制成服务韧性工程(SRE)能力的评估标准模型,给予产品建设方详尽的参考标准。
面向供给方:以方案或工具为评估对象,验证其服务韧性平台(SRE)或工具能力水平
《服务韧性工程(SRE)能力要求》从被动维护、主动优化和组织架构建设三个方向出发提出了以下八个方面的能力要求:SRE架构、产品变更、应急管理、安全运维运营、故障演练、韧性系统可靠性治理、韧性系统可服务性治理、持续运维。并根据在不同能力域的综合表现,分为基础级、增强级、先进级、全面级、卓越级5个能力等级。
企业上云是企业降低成本,提升效率,推进新型工业化的重要抓手。随着企业业务上云步伐加快,企业面临云服务和应用系统关系复杂,维护界面分离,上下游沟通脱节等问题。因此越来越多的企业开始关注应用运维和云平台运维的能力的打通,希望实现业务、应用、云服务实例、云平台资源到硬件基础设施的全面打通,面向业务提供“云+应用”监管控一体化的运维能力,实现故凯时官方网站下载,障的快速发现、定界和恢复,保障云上业务稳定运行。
依据云+应用部署全生命周期对云+应用的逻辑态、部署态、运行态以及运维模型和能力做出要求,分为基础级、增强级凯时AG,、先进级3个能力等级。
算力中心作为新时代的算力基座,GDP增长的重要抓手,已经成为数字经济高质量发展的重要支撑,以数据为资源,以强大的计算力驱动Al模型对数据进行深度加工,源源不断产生各种智慧计算服务,并通过网络以云服务的形式,向企业提供技术支撑。因此,算力中心的稳定安全运行是社会经济活动平稳开展的重要基础,也是我国大力发展数字经济的必要条件,提升算力中心稳定安全运行水平迫在眉睫。
标准通过日常管理,服务支持,容灾管理,资源管理,基础设施,组织建设五个能力域进行检查,分为三星级、四星级、五星级三个能力等级。
标准关注于证券期货行业在维护系统稳定性过程中面临的风险和挑战,结合证券期货行业特点,依据行业发布的《金融标准化“十四五”发展规划》、《证券期货业网络和信息安全管理办法》、《证券公司网络和信息安全三年提升计划(2023-2025)》等指导文件,关注于对关键业务连续运行影响较大的业务系统或基础设施系统,构建了证券期货行业重要系统稳定性成熟度模型。此模型包括组织管理成熟度、机制成熟度、稳定性技术成熟度三个能力域共计21个能力项。
证券期货行业重要系统稳定性成熟度模型由低到高划分为5个等级,即初始级、改善级、规范级、优秀级和卓越级。
金融业务连续性能力成熟度模型由低到高划分为5个等级,即初始级、改善级、规范级、优秀级和卓越级。
金融分布式系统作为驱动金融行业高效运行与创新的核心基础设施,依托分布式架构显著增强了服务效率与体验。伴随云计算、大数据、人工智能等技术的飞速进步,金融分布式系统日益成为金融机构优化服务质量与效率的关键杠杆。作为银行业数字化转型的基石,其风险管理的成熟度直接关乎金融机构的稳健经营与监管效能。然而,风险管理领域仍面临识别不充分、分析不深入、流程不规范等挑战,严重制约金融业风险防控与转型进程。在此背景下,为强化金融机构风险管理,确保金融体系稳健,中国信通院携手产学研用多方专家共同编制《金融分布式系统风险管理成熟度模型》。
《金融分布式系统风险管理成熟度模型》的架构包含风险识别、风险评价及风险应对,构成了一个完整闭环的评估要求,分为初凯时官方网站下载,始级、基础级、全面级、优秀级、卓越级。
随着各行业数字化转型加速,各类系统的规模和架构复杂度呈指数上升,增加了稳定性风险,若风险一经触发将影响众多企业和用户的正常生产生活。通信行业是构建国家新型数字基础设施、提供网络和信息服务、全面支撑经济社会发展的战略性、基础性和先导性行业,做好通信行业系统稳定安全运行保障工作是建设网络强国和大力发展数字经济的必要条件。
标准从机制建设成熟度,能力建设成熟,组织建设成熟度三个能力域出发,设计了42个能力考察项,分为基础级、增强级、先进级3个能力等级。
如何有效、全面地度量系统稳定性、指导稳定性保障能力建设,有目的性地检查、提升整个系统各个组件或环节的稳定性是众多从业者共同面对的难题。
分布式系统稳定性成熟度模型以通信行业标准《分布式系统稳定性度量模型》为评估依据,覆盖稳定指标、故障预防、故障感知与分析、预案能力、故障改进、安全管理及流程机制7大能力域,共34个功能模块,包含125个能力项,是目前业界最权威、完整的稳定性能力成熟度模型。
根据评估结果将参评系统的稳定性分为5个等级:基础级、增强级、全面级、先进级、卓越级(目前开放3个等级)。
运行安全技术能力体系涉及软件全生命周期稳定性保障所涉及的技术点,涉及应用多活、全链路压测、模糊测试、变更管控、可观测性、根因分析、混沌工程、一云多芯、API、消息队列、事务服务、容量管理、云平台交付等技术。
该体系规范了稳定性建设技术能力要求,帮助企业从独立产品能力提升为可靠综合的稳定性建设矩阵,真正理解用户的稳定性建设需求,提升企业产品能力。
在应用系统加速上云的背景下,传统的灾备架构已很难满足业务快速恢复的需要,成功应用、落地应用多活技术构建数字免疫系统成为组织、企业内部的高优先级工作。
《应用多活成熟度模型》关注应用多活项目的执行质及执行效果,指导企业从应用多活架构可靠度、应用成效度及组织建设度三方面按照预定目标和条件成功地、可靠地实施项目落地。
应用多活成熟度针对组织或者企业为评估对象,评估结果分为三个维度:“架构可靠度”、“应用成效度”和“组织建设度”。
应用多活成熟度模型将企业混沌工程成熟度水平分为5个等级:初始级、基础级、全面级、优秀级、卓越级,便于企业自评定位以及设置合理的提升目标。
应用多活是广义“容灾”方案中的高级形态。区别于传统的机房级容灾方案,应用多活方案通过将业务的管理层、流量层、应用层、数据层、基础设施层等高可用方案互相结合与联动,真正实现业务侧的多活高可用架构。
应用多活平台能力评估以通信行业标准《应用多活架构能力要求》为评估依据,基于当前分布式系统稳定性的发展现状与痛点,助力企业增强核心业务的连续性及抗风险能力,保证核心业务的稳定、持续运转。
应用多活架构能力评估将参评平台的能力分为3个等级:基础级、增强级和先进级。
随着软件系统规模得以更进一步扩张,其承载的数据体量与日俱增,逐渐成为威胁系统稳定性的主要因素之一。在此背景下,如何才能准确地把握系统的数据承载量,提前发现服务链路中的性能瓶颈,从而规避数据过载导致的系统崩溃,成为了企业亟待解决的问题。
本评估以《全链路压测平台技术要求》为评估依据,面向全链路压测服务供应方,提出全链路压测技术能力的评估标准模型,协助扩大全链路压测服务在企业中的影响力和接受度,保障海量数据场景下的云系统稳定性。
全链路压测平台能力评估将参评平台的能力分为3个等级:基础级、增强级和先进级。
中国信通院在2021年启动基础软件质量研究工作,并于2021年11月成功立项《云上软件测试能力成熟度模型》行业标准体系,旨在体系化软件质量保障方法,推动产业持续发展。为推动相关工作落实,中国信通院云大所联合清华大学、华为云、京东科技、蚂蚁集团、安般科技、同创永益等近20家企业,历时近4个月,召开6次公开研讨会,共同编制完成国内首个《模糊测试架构能力要求》标准。
模糊测试架构能力要求评估将参评平台的能力分为3个等级:基础级、增强级和先进级。
《变更管控能力成熟度模型》覆盖变更机制建设成熟度、变更全生命周期管理、平台基础能力共三大能力域类型,包括32个能力项。其中变更机制建设成熟度是对企业变更制度、流程、规范管理的考查,变更全生命周期管理是对变更执行前、执行中、执行后的全生命周期管理能力的考查,变更平台基础能力是对平台的权限、安全、高可用等基础能力要求的考查。
《变更管控能力成熟度模型》覆盖变更机制成熟度、变更全生命周期管理、平台基础能力3个能力域类型。
本标准对变更管控能力成熟度进行分级,首批分为基础级、推广级和领航级。(可自选某一能力域类型或子能力域进行评级,也可整体评级)
近些年来,面对日趋复杂的软件系统,即使是已经全球领先的技术公司仍然无法避免大规模宕机事故的发生,企业急需更多的手段和工具去保障软件系统的稳定性。而可观测性,则是保障软件系统稳定性的基石:如果软件系统内部情况都不可观测,则更无从谈起故障分析和系统改进等稳定性保障手段。
可观测性平台能力评估以通信行业标准《可观测性平台能力要求》为评估依据,面向可观测性工具和平台,提供全面的可观测性平台能力参考规范,助力可观测性产品为更多企业软件系统的稳定性保驾护航。
可观测性平台评估将参评系统的可观测性能力分为3个等级:基础级、增强级和先进级。
为了帮助企业规划其可观测性建设的路径,中国信通院从用户的角度出发,构建了《可观测性能力建设成熟度模型》标准,这一模型的目标是为组织提供一种有效的评估和指导方式,帮助企业内部建设可观测性能力,从而提高IT系统的稳定性和安全性。
标准从观测能力建设、应用场景、组织建设三个方面评估可观测性能力的建设水平,分为基础级、增强级、先进级三个能力等级。
随着云计算技术的发展,软件架构向分布式化、解耦合和工程化等方向演进,软件系统结构日趋复杂,大大提高了系统稳定性故障的排查难度。根因分析技术可以利用系统运行观测数据,辅助分析故障来源与成因,帮助运维人员实现更加高效的系统故障排查与解决。
本评估以《根因分析平台技术能力要求》为评估依据,面向根因分析工具及平台,提出根因分析能力的评估标准模型,提升故障解决效率。
根因分析平台技术能力评估将参评系统的可观测性能力分为3个等级:基础级凯时AG,、增强级和先进级。
混沌工程平台是实施混沌工程中故障演练的主要工具,组织要建立完整混沌工程能力,需要综合软件开发的技术水平以及混沌工程实验的管理能力。
混沌工程成熟度评估以通信行业标准《混沌工程成熟度模型》为评估依据,预期为需求方提供一个阶梯式的建设框架,指明一个组织在混沌工程实践方面需要管理哪些工作、这些工作之间的关系、先后次序,推动该组织的混沌工程能力逐步走向成熟。
混沌工程成熟度针对组织或者企业为评估对象, CEMM的评估结果分为三个维度:“工程熟练度”、“应用成效度”和“组织建设度”。
混沌工程成熟度模型(CEMM)将企业混沌工程成熟度水平分为5个等级:初始级、基础级、全面级、优秀级、卓越级,便于企业自评定位以及设置合理的提升目标。
混沌工程是一种新型的测试理念与工具框架,通过主动引入故障的方式来验证分布式系统的稳定性,《混沌工程平台能力要求》是可信云针对混沌工程平台而制定的标准。
混沌工程平台能力评估以通信行业标准《混沌工程平台能力要求》为评估依据,规范了混沌工程平台应具备的功能及服务能力,覆盖基础设施、平台功能、平台性能及支撑能力,平台功能包括故障场景、介质管理、场景库管理、演练计划、实验流程、实验防护、实验观测及实验报告,近100个评估项。
混沌工程平台能力划分为基础级、增强级和先进级,技术复杂度由低到高,梯度指导厂商能力建设,有效证明并提升参评服务的混沌工程技术能力。
2023 年 2 月,国务院印发《数字中国建设整体布局规划》,规划指出要强化数字中国关键能力,构建自立自强的数字技术创新体系。在此背景下,一云多芯需求将持续释放,IT产业全链路国产化替代已成为大势所趋。
《一云多芯稳定性度量评估模型》关注一云多芯架构的建设部署情况,指导企业从规章制度、平台建设能力、稳定性故障演练、安全运行能力等四方面按照预定目标和条件成功地、可靠地实施信创项目落地。
以一云多芯架构产品为评估对象。针对一云多芯领域关注的实际落地情况、性能、兼容性、稳定性等方面,要充分体现技术的先进性、实用性、通用性,评估结果分为四个维度:规章制度、平台建设能力、稳定性故障演练、安全运行能力。
一云多芯稳定性度量评估将企业多芯异构产品成熟度水平分为3个等级:基础级、增强级、先进级,便于企业自评定位以及设置合理的提升目标。
API是企业能力开放的核心,也是整体数据化转型中重要的能力介质,越来越多的服务通过API开放,也在一定程度上触发了行业中API经济的快速发展,本标准定义的API全生命周期包含了规划、设计、实施、测试、发布、运维、消费、版本控制和API下线整个完整的流程。
此标准主要从应用能力要求、消息队列功能要求、运维支撑能力要求、安全能力要求和性能要求这些维度对企业消息队列的能力进行考察,包括31个能力项。其中应用能力要求关注于系统的普适性和可编辑性,功能要求着重于测试消息队列的基础能力和增强特性。运维支撑能力要求消息队列保证在故障发生后保持业务稳定,且具备快速故障定位和处置的能力。安全能力要求需要企业保证系统不受外部安全攻击的影响。性能要求对系统的流量处理性能做出了具体的要求。
此项标准从功能、性能和安全三个方面对分布式事务服务提出了要求。评估企业分布式服务的功能要求包括对其资源管理、事务管理、数据管理和运维管理能力的考察。性能要求则会对分布式事务服务进行吞吐量、可用性等性能指标的考察。安全要求则会从身份鉴别、权限控制、安全审计、数据安全等方面对企业进行考察。
随着云计算技术的发展,软件架构向分布式化、解耦合和工程化等方向演进,软件系凯时官方网站下载,统规模得以更进一步扩张。在此背景下,有效的资源规划和容量管理可以全面有效地分析系统的容量需求,实现资源利用最大化。
为了能够支撑容量管理的技术发展和能力规范,推动相关技术和产品在业界的普及实施,中国信通院构建了《智能容量管理技术成熟度》标准。通过建立详细的指标项,编制成容量管理能力的评估标准模型,给予产品建设方详尽的参考标准。
增强级:在基础级能力上,能够保障稳定性,对于容量故障(如业务高峰、资源故障)做出应对;
先进级:在增强级能力上,能动态分配资源,达成利用率最大化,降低冗余,实现降本增效。
在数字化时代,云计算作为推动企业运营和业务创新的核心技术手段,其云平台交付能力的构建与优化至关重要。云平台交付能力不仅涵盖了从交付能力培训认证、资源高效配置到应用服务快速部署、稳定转运维等全过程,确保了企业在日常运作中能够获得坚实的IT支撑,更是提升业务创新能力、增强市场竞争力的关键因素。随着云计算技术的快速发展及应用场景的广泛拓展,建立一套全面、灵活且安全的云平台交付体系成为企业迫切需求。
标准包含了培训体系、组织管理、交付模型、交付标准和交付工具五大模块,分为基础级,增强级,优秀级。
中国信通院开展了针对云服务稳定性的评估测试体系建设工作,联合了阿里云、腾讯云、天翼云、华为云、移动云、京东科技、浪潮云、火山引擎、深信服等四十余家企业共同参与标准编制,历时6个月,推出『可信云·云服务稳定性专项评估』,目前覆盖11类云服务,包括云主机(含宿主机)、云存储、云网络、容器集群、消息队列、分布式缓存、云数据库、内容分发、DNS服务、GPU云服务、GPU集群,未来将持续开放更多类型的云服务稳定性专项评估。该体系已经成为企业产品选型、能力验证的重要依据,提供了多维度、多场景、多层次的云服务稳定性考察方案,助力企业打造可信、安全、稳定的云服务品牌!
目前,『可信云·云服务稳定性专项评估』工作体系的评测等级开放至3级(先进级)。
合同确认后,我们会安排测试人员对接,向参评企业提供详细测试方法,并安排答疑和预约排期。
评测结束后,将召开专家评审组会议,评审专家组成员由行业技术专家组成,评审组将对完成测试的参评企业及其产品报告进行评审,通过专家组评审方可获得证书。
原标题:《稳保行动 中国信通院2025年“可信云·系统稳定性保障评估”开启报名通道》
本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问。