湖北数产集团:智能运维赋能数字经济,一体化平台助力转型

2025-03-29 16:02:10

      湖北省数字产业发展集团(以下简称“湖北数产集团”)是湖北联投集团于2020年6月全资组建的唯一省级数字产业投资建设运营平台,肩负着“科技创新的引领者、产业发展的推动者、城市更新的建设者、美好生活的创造者”的使命。集团秉承“政府主导、市场运作”的原则,汇集管理政府数据资产,激发数据要素价值,培育全数字产业链的集群生态,具有“省市区数据联动、多业务板块协同、本地化长效运营”的核心优势,担当湖北数据要素改革先行军、数字经济发展排头兵,是湖北省数字经济高质量发展的“主力军”,推动产业转型升级的重要引擎和龙头企业,在数字湖北建设中发挥国有经济战略支撑作用。

 

      一、数字化转型建设不断深化,运维面临新的挑战

      随着数字化转型的浪潮席卷各行各业,企业运维体系也面临着前所未有的转型升级压力。传统的运维模式已难以充分满足企业对高效、稳定、智能运维的需求,特别是在云原生、大数据、人工智能等技术快速迭代的当下,运维体系的智能化、自动化、数字化成为企业持续发展的重要支撑。

      在当前运维现状下,联投湖北数产集团在楚天云、国资云承接的众多应用系统面临着系统架构复杂、技术栈多样、服务调用关系繁琐等挑战。云原生技术的引入进一步加大运维难度,且现有的运维团队专业技术人才储备有限,缺乏一体化、集约化运维手段,运维压力增加,难以满足未来架构扩展带来的技术挑战。同时,集团对应用系统的高质量体验提出更高要求,使得运维工作面临新的机遇和挑战:

 

      二、构建业务管理一体化平台,打造运维监管新体系

      面对数字化转型带来的新挑战,湖北数产集团携手嘉为蓝鲸共同打造业务管理一体化平台,构建“纵向监督、横向联动”的一体化运维监管体系。对于现有存量应用,采用“无感接入、运维融合”的策略;对于新增系统,采用“三步走”方法,快速提升应用系统的运维能力,实现运维工作质的飞跃。

      业务管理一体化平台集IT服务台、统一配置管理、监控告警、自动化运维等多种功能于一体,通过统一的平台,运维团队能更为高效地管理运维任务,减少信息孤岛,提高协作效率。平台支持自动化运维工具和运维开发框架,实现日常运维任务自动化,减少人工干预,提升运维效率与准确性。平台具备灵活性和扩展性,支持新信创环境,且能通过API网关,无缝对接国资云、政务云、容器云及本地设备,确保功能模块间有效协作,推动运维场景融合。

      统一配置管理:建立统一配置管理系统,规范数据标准与治理;为业务交付场景提供数据配置、实例拓扑及配置自动采集服务;通过自动化技术实现配置数据的增量采集。

      统一监控管理:构建统一监控系统,全方位监控操作系统、数据库、中间件、云平台以及业务应用;基于多层架构,全面采集、处理、分析和展示监控数据;具备自动告警功能,根据设定阈值和规则生成告警信息,及时通知运维人员。

      集中告警中心:构建集中告警中心,集中处理告警信息,实现自动化分派和自愈;通过灵活的告警策略配置、多渠道通知以及深入分析和趋势预测,降低运维成本,增强对潜在系统风险的预测能力。

      IT服务管理:构建IT服务管理平台,提供统一访问入口,集成服务请求、时间、问题、变更和知识管理等流程;支持多渠道访问,满足不同角色的需求;插件商店支持功能灵活扩展,具备多种平台能力。

      此外,为确保技术人员能够熟练掌握新系统的操作,嘉为蓝鲸提供了系统的培训,包括平台运维培训、产品使用培训、脚本开发培训与运维开发培训等,为集团的运维工作提供有力的知识支持。同时,项目实施后,嘉为蓝鲸将提供7x24小时的技术支持,确保系统的稳定运行,并及时解决用户问题。通过建立用户问题管理机制,运维团队能够快速响应用户需求,提升服务质量。

 

      三、业务管理一体化推动运维数字化

      1、统一配置管理:构建集团企业级数据管理新体系

      建设集团企业级资源管理方案,实现数据统一管理,解决了数据开放性不足、数据质量难以保障以及数据难以有效度量与复用等挑战。以业务为导向,为各交付场景提供多种服务,涵盖配置项管理、配置库维护和配置审计等多个方面,保障集团IT配置信息的一致性和准确性。

      目前,共设计了40+个IT资产模型对象,纳管超过60个业务系统以及40+台主机,并采集业务管理一体化平台上的中间件和数据库。

      2、统一监控管理系统:全面提升运维效能

      构建统一监控管理系统,全方位监控操作系统、数据库、中间件、云平台以及业务应用。基于多层架构,全面采集、处理、分析和展示监控数据。具备自动告警功能,根据设定阈值和规则生成告警信息,及时通知运维人员。

      目前,监控平台已接入嘉为蓝鲸全栈智能观测中心阿里云两个告警源,并监控40+台主机,配置4类中间件4类数据库以及超过70个拨测任务

      3、统一告警管理:构建高效告警处理闭环

      构建集中告警中心,集中处理告警信息,实现自动化分派和自愈。通过灵活的告警策略配置、多渠道通知以及深入分析和趋势预测,降低运维成本,增强对潜在系统风险的预测能力。平台具备告警自愈、告警分析、告警抑制、告警屏蔽、告警转工单等功能,实现“告警精准捕获-告警集中接入-告警快速丰富-告警高效抑制-告警主动屏蔽-告警定向派单-告警处理-告警及时关闭”告警事件全生命周期闭环,提高告警处理的效率和准确性。

      当前共接入20+个系统平均收敛率90%;截至目前共发生1100+次原始告警有效告警转工单100+

      4、IT服务管理:实现IT服务全生命周期管理

      构建IT服务管理平台,提供完整的IT服务管理流程和服务目录。通过请求、事件、问题、变更、知识等流程管理服务,实现对IT服务全生命周期的管理和监控。平台支持与自动化执行、配置管理系统、集中告警系统的数据交换和功能联动,满足流程功能自定义扩展需求。系统共上线8个流程,运行期间产生了20+条工单

 

      四、总结

      通过构建业务管理一体化平台,湖北数产集团的运维效率和质量得到提升,实现运维工作的数字化转型。未来,该平台将持续发挥强大的运维管理能力,帮助数产集团更好地应对各种运维挑战。湖北数产集团与嘉为蓝鲸将共同致力于推动运维管理的创新发展,不断深化合作成果,为数产集团的数字化转型和业务发展提供强有力的支撑。

安保医疗护航横琴马拉松,稳助万名跑者无忧竞速
相关文章
返回顶部小火箭