当前位置: 首页 > 党团工作 >

从实际出发 科学合理地建设运行维护监控技术平台

发布时间:2023-07-01 13:36:07 | 来源:网友投稿

摘要:文章阐述了建设运行维护监控技术平台的重要意义,提出了建设符合中国邮政实际的网络管理系统需要解决的主要问题,论述了建设运行维护监控技术平台的设想。

关键词:运行维护;技术平台;网管系统;信息化;实践

中图分类号:F61

文献标识码:A

中国邮政信息化的历程,是中国邮政的广大干部职工在国家邮政局党组的正确领导下,从中国邮政的实际情况出发,用信息化改造和提升传统邮政产业的历程。中国邮政信息化的历程,也是马克思主义认识论在邮政行业的一次成功实践。

随着邮政的生产、经营和管理对邮政信息网的依赖性逐渐增强,越来越多的人认识到加强运行维护技术手段,建设运行维护监控技术平台的必要性。但是对于建设一个什么样的运行维护监控技术平台,怎样建设这个平台并没有形成广泛的共识。另一方面,如何将中国邮政信息网的实际与当前市场上商业化的网络管理产品和先进的运行维护服务管理理念结合起来,建设一个科学合理的运行维护监控技术平台,是中国邮政信息化道路上的一个新考验。在这方面,其他行业在信息化过程中的经验教训值得借鉴。

建设运行维护监控技术平台,要坚持一切从中国邮政的实际出发,认真分析中国邮政的实际情况,正确认识邮政信息网运行维护的特点,清醒地认识运行维护监控技术平台的需求,才能把这项工作做好。近两年,我们先后组织了邮政综合计算机网网络管理系统技术方案、邮政综合网运行维护管理网站总体方案两个科技项目的研究,并通过国家邮政局科技主管部门组织的评审。本文结合这两个项目的实施过程谈一些思考和设想。

1 建设符合中国邮政实际的网络管理系统

1.1 网管系统要解决的主要问题

1.1.1及时准确地发现和定位故障,成为运行人员的“千里眼”、“顺风耳”

运行维护工作是以保障邮政业务正常进行为中心的,而故障处理又是安全运行中最重要的环节,因此邮政综合网网管系统应具备及时准确地发现、定位网络、中间件、数据库、操作系统、应用系统故障的功能,帮助运行维护值班人员及时发现和定位故障。

1.1.2进行定期性能监控、分析,以便发现故障隐患,防患于未然

网络和主机系统性能下降也是故障的重要前兆,因此网管系统应具备有效的性能监控功能,定期监控系统性能参数,供网络和系统分析人员对采集的性能数据进行分析,以便及时发现故障隐患,采取相应措施,减少故障发生的频率。当故障发生时,借助网管系统对相关参数和指标进行分析和判断,直至解决故障。

1.1.3定期统计全网(重点是全国中心和省中心两级)运行维护指标,为运行维护质量的考核提供依据

网管系统应根据运行维护管理和考核的需要,汇总和统计一定时期内的重要运行维护指标,准确反映全网整体运行状况,为全网各级中心运行维护质量的考核提供依据。

1.1.4满足安全管理的需要,对网络病毒等进行有效防范

随着综合网网络规模的不断扩大和应用系统的不断增加,确保各项业务的安全生产已经成为运行维护工作的重要内容。因此,网管系统不仅要满足故障处理、性能监控等方面的需求,更要结合邮政信息网的特点,将安全管理的内容纳入其中,从而在病毒、非法入侵等方面进行有效防范。

1.2 网管系统的基本功能和管理对象

1.2.1网管系统的基本功能

故障管理是最重要的网络管理功能,主要是以可闻、可视等方式,从多个角度实现对全网各类告警信息的实时采集、综合处理和数据存储,以便对故障进行记录、告警、分析、定位直至解决。

性能管理主要是通过性能数据的处理与分析,及时发现关键参数的异常情况,以便采取预防措施,保障系统正常运行,并为系统的进一步优化提供依据。

运行质量管理主要依托网管平台对全网大量运行数据按规定的期限进行统计、归纳,并以报表等形式表示出来,供运行维护管理部门对全网运行维护质量进行评估和考核。

1.2.2网管系统的管理对象

网管系统的管理对象应包括邮政信息网的硬件资源和软件资源,即网络设备(广域网和局域网)、主机系统、数据库、中间件和各应用系统。

1.3 网管系统的使用者

谁是网管系统的使用者也是建设网管系统首先要考虑的因素之一。

1.3.1值班员

值班员通过网管平台迅速、直观地了解系统的运行状态,发现故障及时作出反应。

1.3.2网络和系统分析工程师  网络和系统分析工程师在系统发生故障时能够通过网管平台实现对故障的准确定位、处理,未发生故障时能够对网管数据进行分析,发现异常情况对故障进行早期预警。

1.3.3运行维护工作的领导

通过运行维护质量的相关分析报表,运行维护工作的领导可以全面了解全网的整体运行维护状况,为考核提供依据。

1.4邮政信息网发展现状

据初步统计,目前邮政信息网有主机系统3000台/套,网络设备20000台/套,PC机或网络终端20万台,设备所在地点从全国中心直至营业网点,全网统一开发和维护的应用系统有20多个。如此众多的设备和系统,构成的网管对象和要素十分庞大。而据初步统计,全国信息技术队伍约有8000人,其中省中心以上专职信息技术人员1300多人,如按40%计算,从事运行维护工作的有520多人,其中高水平的网络和系统分析工程师约占30%,即150人,他们中的很多人在从事运行维护工作的同时还参与工程建设。如何用如此紧缺的人力资源管理和监控如此庞大的信息网,哪些要素需要纳入网管系统,哪些要素可以不纳入网管系统,需要认真分析研究。

1.5邮政信息网网管的现状

邮政信息网现有部分网管手段起到了一定的作用,但远不能满足运行维护的需要。

1.5.1广域网网管现状

广域网设备有基于产品的网管系统,基本可以完成广域网设备的故障、性能和配置管理,但故障报警、网络流量监控和统计等功能相对较弱,且由于购买时间早,其硬件配置较低。

1.5.2局域网网管情况

综合网在建设初期,为全国中心和31个省(区、市)中心配置了网管系统的硬件和软件。2004年,在信息技术局的多方努力和相关公司的积极配合下,试开通了全国中心和31个省中心电子汇兑主机系统的部分网管功能,但由于购买时间早,软件版本和服务器配置较低,网管功能难以正常发挥。

1.6网管建设的实现途径

1.6.1 “网管平台+二次开发”的方式

这种方式首先选择网管系统平台。网管平台通常由协议运行软件包、MIB编译器、网管应用编程接口和图形化用户界面组成,可以说是网管系统的半成品。在此基础上,针对用户的需求进行二次开发,即“客户化”或称“定制”。

1.6.2自主开发方式

理论上说,可以按照SNMP(简单网络管理协议)自行

开发网管系统,但是像邮政综合网这样的大型信息系统管理对象众多,规模巨大,实际上很难完成。目前这种方式一般用于局部的、功能单一的计算机网络。

1.6.3购买现成的商业化软件包

购买现成的商业化软件包虽然便捷,但用户的需求随行业和应用的特点千差万别,单纯依靠商业化的网管产品很难解决用户的个性化需求。

目前,业界比较成功的做法是选择一个最能够满足邮政信息网基本需求的商业化网管产品,在此基础上,按照网管需求进行充分的二次开发和集成,这是符合中国邮政实际情况的网管系统实现方式。

1.7 目前国外网管产品的初步分析

1.7.1商业化网管产品在发达国家的应用背景和发展历程

随着时代的变化,网络管理的概念在内涵和外延上都在发生变化。从基于网络设备的网管,到通用网络设备的网管,到包含系统管理的网管,到包含数据库的网管,再到包含应用软件进程管理的网管,商业化网管产品随时代的变化不断扩充内容,将越来越多的产品整合进来,变成了一个庞大的产品家族。

发达国家的网络管理高度专业化,企业将网络管理工作外包给专业化的网络管理公司,这些专业化的网络管理公司有大量专业技术人员全天侯使用网管产品对网络进行监控和维护。这种高度专业化的社会分工是社会生产力高度发达的产物,它有利于全社会人力资源的集约化配置。

1.7.2国外网管产品的优劣势

优势:健壮性较好,运行稳定,有丰富的接口和插件,部署快速,性能管理是其长项。

劣势:故障监控和告警功能较弱(过于敏感、误报警、没有明显的声光显示等),对历史数据的统计和归纳功能不足,需要增配数据库进行二次开发,对使用者的要求较高。

1.8符合中国邮政特点的网络管理系统的基本设想

中国邮政信息网网络管理的基本设想见图1。

如图l所示,邮政信息网网络管理系统应主要由网络管理模块、主机系统管理模块、应用软件管理模块三部分组成,分别完成对各网络设备、主机系统和各应用软件的网管功能的集成,使三个模块分别具有故障管理、性能管理和运行质量管理的功能。其中网络管理模块和主机系统管理模块可以在科学论证的基础上选择一种或两种不同的网管产品,并以此为基础进行二次开发。应用软件管理模块应由各应用软件开发商开发,在基本功能的确定上,可以汲取金融信息系统处理异常交易情况时的思路,即加强对各类业务信息是否成功发出和接收情况的监测机制,还应包括数据库表空间、文件系统等重要软资源使用情况的监测功能。这样,三个模块各有侧重,相辅相成。在监控界面数量的考虑上,要尽可能地集成化,以便比较少的运维值班人员统一监控各类设备和系统。

1.9网络管理模式的考虑

一般来讲,一个大型的企业级信息网有三种网络管理模式,即集中式网络管理模式、分布式网络管理模式、集中式与分布式网络相结合的管理模式。

与之相关的管理信息采集的机制有三种,即轮询机制(polling)、基于中断机制(imerrupt-based)、陷入制导轮询机制(trap-directed polling)。

综合考虑以上各项因素,邮政信息网的网络管理模式见图2。

图2所示的集中式与分布式相结合的网络管理模式是考虑到故障管理信息的采集一般采用中断机制,对网络资源的占用较少。性能管理信息的采集一般采用轮询机制,对网络资源的占用较多。本方案中性能管理信息的采集主要在全国中心和省中心的局域网环境内完成,不会给广域网本来就紧张的带宽带来更大的压力,同时又满足了全国中心和省中心故障管理信息采集的及时性要求。

1.10 网络管理系统建设的指导思想和建设原则

1.10.1突出重点,抓住关键,注重实效

运行维护支持平台的建设与其他业务和管理系统不同。邮政信息网的网管涉及广域网、主机系统、数据库、各类应用软件等多种设备和软件,需要管理的对象非常庞大。鉴于邮政的资金有限,网管建设应突出重点,抓住影响信息网安全运行的关键指标进行监控,尽快取得实效。网管系统的建设应当起到四两拨千斤的作用。

1.10.2贴近生产,注重流程,规范管理

一个实用的网管系统的设计不应仅专注于技术层面,还应该正确反映在正常生产和发生故障时业务系统与技术支持平台之间在工作流程上的衔接,如问题管理、故障管理、配置变更管理等。因此,深入了解相关业务流程,找到各生产环节与技术平台之间的对应关系,并将其反映在网管系统的设计中是十分必要的。

1.10.3总体规划,分步实施,统筹兼顾

综合网网管建设工作是一项需要统筹安排、量力而行的系统工程。要在长远规划的基础上,重点对影响安全运行的主要问题进行重点分析和解决,使网管建设做到重点明确、层次清晰、由小到大、由少到多、由浅到深、由简单到复杂,经过若干年的努力,逐步建成功能完善的网络管理系统。

2 建设邮政信息网运行维护网站

2.1建设运行维护网站的目的

邮政信息网运行维护全程全网和迅速响应的特点需要一个畅通的信息交流平台和一个生产指挥命令下达和反馈的快速通道。

2.2运行维护网站应有的主要功能

运行维护网站应有的主要功能包括:信息交流(实时性不强),生产运行管理(在线值班日志,值班员签到,有一定实时性要求),信息发布(实时性较强),生产指挥命令的下达(指挥调度令的管理,实时性很强),知识管理(知识库),运行维护的流程管理(故障的受理、记录、处理、跟踪、反馈等),多层次的权限管理,安全的要求(实名制)。

2.3其他需考虑的问题

其它需要考虑的问题包括全国设几个网站,网站的内容按什么分类,省局的特殊需求如何体现,用户的范围到哪一级等等。

2.4 网站技术的发展背景和特点

网站技术伴随着因特网的发展而成长,其特点是无地域概念,适用于信息的交流。不足之处是安全性较差,用户权限层次少。

2.5关于运行维护网站的结论性意见

一是网站应充分反映邮政信息网生产运行的特点,满足7×24小时不间断生产运行的需要。二是网站的内容应主要根据网络的软、硬件资源分类和已经统一版本的应用系统进行划分。三要加强网站的安全性,实行实名制。四是网站应集中设置在国家邮政局,可以用链接的方式连接各省的运行维护网站。省局的特殊需求主要体现在省级网站上。五是用户的范围到邮区/地市中心。

3 运行维护监控技术平台的初步设想

运行维护监控技术平台的初步设想见图3。

运行维护监控技术平台应由故障响应中心、网络管理系统、运行维护网站三个基本部分组成,三位一体,相辅相成。

故障响应中心是用电话集中受理故障申告和进行故障管理的统一窗口,利用一定的通信和技术手段,调动各种内外

部资源,并对故障的处理情况进行记录、跟踪、反馈。故障响应中心的技术手段视实际情况而定,并不一定必须采用呼叫中心的技术和设备,可以采用简易方式通过规范故障处理流程实现。

网络管理系统是运行维护队伍对信息网进行监控和分析的有力工具,能够7×24小时实时监控信息网关键设备和系统的运行状态,并对异常情况进行告警,对主要性能的变化进行早期预警,对主要运行质量指标按规定时间进行汇总、考核。

运行维护网站是运行维护管理信息交流的平台和生产指挥的快速信息通道,覆盖范围从全国中心、省中心到邮区中心,主要用于日常生产运行管理。

邮政信息网作为一个大规模的企业信息网,无疑是现代信息技术和邮政人智慧的结晶,但其自我感知和管理能力还相当于一个不满周岁的婴儿,需要邮政信息网的运行维护人员具有父母般的责任心以及医生一样的专业知识和职业道德。

此外,信息网是一个虚拟的世界,管理虚拟世界必须用符合虚拟世界客观规律的技术手段。因此,一个科学合理的运行维护监控技术平台对邮政信息网的管理是必不可少的技术手段。同时,从图3也可以看出,多种技术手段才能构成一个完整的运行维护监控技术平台。除了网管系统外,还应配备一些必要的设备。

经过全网运维战线职工几年来的扎实工作,邮政信息网的运行维护工作在规范化、制度化建设方面已经打下了坚实的基础。下一步应在继续加强各项运行维护管理的同时,适时考虑运行维护监控技术平台的建设。同邮政信息化的建设历程一样,人们在认识运行维护的客观规律时,总是遵循着实践、认识、再实践、再认识,不断由低级向高级的演进过程,而实践是一切正确认识的基础。因此,在运行维护监控技术平台的建设上,应认真分析中国邮政的实际,大胆实践,将邮政信息网的运行维护水平推向一个新的高度。

作者简介:夏鹰(1952~),男,浙江温州人,教授级高工,国家邮政局科技委办公室主任,主要从事信息系统运行管理研究。

南天电子信息产业股份有限公司简介

南天电子信息产业股份有限公司(简称南天信息),是集软件开发、系统集成和金融设备与其它信息化产品的开发、生产为一体的国内著名的IT信息化服务厂商,于1999年在深圳证券交易所上市。

南天信息在中国金融行业市场及IT专业服务业中具有突出的优势地位。通过遍布全国的区域公司和分支机构与中国金融行业及其它行业的广泛合作,南天信息成为中国金融电子信息市场最主要的金融专用设备产品供应商及IT专业服务提供商。经过多年的投入和建设,南天已建立起规范的质量保证体系,于1997年正式通过了IS09001质量体系认证,为中国金融界提供了3000多台套自动柜员设备、近50万台Nantian PR系列高级存折打印设备、7000多台南天BST自助服务终端设备、40多万台套磁卡读写设备及相关的技术支持和服务,国内各大商业银行、专业银行及新生银行都使用了南天以上产品。

南天与众多国际知名IT厂商建立了广泛的战略合作伙伴关系,并已获得信息产业部计算机信息系统集成一级资质认证,通过IS09001:2000版国际质量认证,并通过了CMM3评估。根据各行业需求,南天开发了多个自有品牌的应用软件产品及解决方案,如OFP开放式金融应用平台,包括金融前端应用开发平台OFP AutoBranch、金融综合前置平台OFP PreBranch、商业银行综合业务系统OFPCoreBanking等。成功完成了近千个计算机应用系统工程,在2000多家金融及其他行业客户中推广了南天自行开发的解决方案和软件产品。

南天信息连续13年进入国家电子百强企业及信息产业十强行列。1998年被国际IDC公司评为亚洲本地最具代表性的系统集成商。2002年起连续4年入选中国电脑商500强和中国十大成功方案商金榜(Most Valuable Part—ner)。2004年被赛迪顾问评为最有竞争力的服务提供商。2005、2006年连续两年荣登中国计算机协会评选的中国信息产业行业大奖奖牌榜,荣获2004年度和2005年度“金牌服务企业”、“2004年度最有价值打印机产品”、“2005年度行业采购存折打印机产品首选品牌”等称号;南天金融前端平台OFP(r)AutoBranch及南天金融综合前置平台OFP(r)PreBranch+则荣获“2004年度最有价值金融应用软件产品”和“中国信息产业2006年度行业采购首选品牌”称号。

推荐访问:实际出发 科学合理 运行维护 监控 建设

本文标题:从实际出发 科学合理地建设运行维护监控技术平台
链接地址:http://www.ylwt22.com/dangtuangongzuo/2023/0701/270023.html

版权声明:
1.十号范文网的资料来自互联网以及用户的投稿,用于非商业性学习目的免费阅览。
2.《从实际出发 科学合理地建设运行维护监控技术平台》一文的著作权归原作者所有,仅供学习参考,转载或引用时请保留版权信息。
3.如果本网所转载内容不慎侵犯了您的权益,请联系我们,我们将会及时删除。

十号范文网 |
Copyright © 2018-2024 十号范文网 Inc. All Rights Reserved.十号范文网 版权所有
本站部分资源和信息来源于互联网,如有侵犯您的权益,请尽快联系我们进行处理,谢谢!备案号:粤ICP备18086540号