1、客户介绍
中国移动通信集团西藏有限公司(以下简称中国移动西藏公司),于2000年6月9日挂牌成立,下辖七个 地市分公司。2002年在西藏通信行业率先实现赢利,改变了西藏通信行业不赢利的历史。2004年6月,在国务院统一部署下,根据中国移动集团公司“整体 上市、分步实施”的思路,中国移动西藏公司在海外成功上市。
作为区内最大的移动通信企业,中国移动西藏公司坚持“服务西藏、服务全 网、立足长远、兼顾效益”的企业定位,加快企业建设与发展,增强核心竞争力,取得了较好的运营业绩和社会效益。2006年启动的青藏铁路沿线移动网络覆盖 工程,使青藏铁路西藏境内铁路线移动网络覆盖率达到85%以上,为青藏铁路正常运营、乘火车进出藏的旅客以及铁路沿线的农牧民群众提供便捷和畅通的通信保 障,被人们亲切地称为“天网”。2007年,在中国移动总部和自治区党委、政府的支持下,中国移动西藏公司全力打造拉萨至珠峰大本营沿线这一世界上最高海 拔的移动网络覆盖工程,使沿途信号覆盖率达到 90%以上,将为2008年北京奥运圣火珠峰传递活动提高通信保障。目前,中国移动西藏公司移动网络已覆盖全区七地市、74县(市、区)政府、1个县级口 岸所在地和主要交通干线、重要集镇、边防要地以及旅游景点(包括珠峰大本营、纳木措、羊湖等)。
2、案例背景
中国移动经过几年的信息化建设,已经建成了统一信息平台Portal、OA、邮件等多个应用系统。企业各个业务所需要的应用系统,极大地提升了企业的信息化水平,提高了工作效率,基本实现了无纸化办公。
随着应用系统越来越多、越来越深入,员工的日常工作已离不开这些应用系统,应用系统的运行状况直接影响着员工办公、企业生产,因此确保应用系统安全、可靠、稳定地运行成为系统维护部门越来越重要的问题,尤其是员工日常办公必需的OA系统。
中国移动的OA系统在2007年1月上线,采用Lotus Domino平台,供全省5000名员工办公使用。在OA系统维护工作中存在着如下问题:
◆系统需要人工监控,维护量巨大,并且无法一一监控到位,同时不能做到持续地实时监控。
◆忙于应对已发生的故障,被动响应式的工作方式,解决故障的效率低。
◆Lotus Domino无故宕机,很难及时发现和预见问题的发生。
◆问题出现后,很难快速、准确地找到根本原因。
◆问题找到后,缺乏流程化的故障处理机制。
◆支持过程总是被打断和干扰。
◆缺乏过程和变化的跟踪记录,如系统运行状况、主机配置变化、应用模块变更等。
◆不能及时地统计、分析系统状况,供领导决策。
结果造成维护部门在出现问题时疲于应付、导致维护工作的满意度较低,这些问题一直困扰着IT维护部门。维护部门非常迫切地希望改变目前的这种状况。
为了解决以上一系列问题,真正实现IT服务全过程一体化,包括管理、监控、统计分析等,并通过组织、流程和制度的完善以及相应的技术设施的建设来支撑和保障IT部门的整体服务水平,我们为中国移动用户提供了基于Mocha BSM产品的应用监控解决方案。
3、实施方案介绍
3.1 产品概述
摩卡业务服务管理(Mocha Business Service Management),简称Mocha BSM,整合了系统管理、监控、工作流、统计分析和门户等多种技术,是对ITIL的IT服务管理核心流程的实现,是一个实用、可扩展的技术解决方案。
Mocha BSM Lotus Domino应用监控是一个专门针对Lotus Domino系统提供监控、故障定位、统计报告等功能的组件。
该产品主要具有以下功能:
◆提供面向“服务”的,整合网络、主机、应用、服务等各层面IT资源的、统一的IT服务管理信息视图。
◆实时监控OA系统的运行状态,及时发现问题。
◆告知事件对企业影响的严重程度。
◆准确、快速地定位故障产生的根本原因。
◆根据严重程度和优先级别,触发相应的处理流程。
◆提供统计报告和分析图表,为领导层提供决策依据。
3.2 功能描述
中国移动OA应用监控系统是基于Mocha BSM产品,该产品为中国移动提供了统一的、集中的IT服务管理平台。系统包括系统监控、报表展现、可视化监控等主要功能。
3.2.1 系统监控功能
通过对OA系统的主机、平台、应用等方面的监控,实现了对OA系统在性能上、可用性上全方面的跟踪,能够及时发现故障、确定故障影响严重性并能定位故障根本原因。
主机信息监控:提供对OA系统所在服务器进行实时监控。
平台信息监控:监控Lotus Domino平台指标信息直接决定提供服务的性能,从根源上管理平台可用性。
应用信息监控:多年经验汇聚提取OA应用层面重要指标,预防为主。 ◆主机方面
监控运行于省公司的OA应用、邮件应用、Portal的六台UNIX主机,包括CPU、内存、硬盘、OS 文件系统等运行状况的重要指标。
监控时间频度为5分钟采集1次(监控时间频度可以自行配置)。

主机监控一览界面
◆平台方面
包括运行于省公司、地市分公司的OA应用、邮件应用的Lotus Domino服务。Lotus Domino平台监控的指标主要包括:
应用平台
-AMGR(TASK)状态
-Lotus Domino Server状态
-HTTP(TASK)状态
-HTTP活动线程数
-HTTP响应时间
-Web代理设置状态
-超时信号灯状态
-丢弃的会话数
-服务器1352端口状态
-NSF数据库状态
邮件平台
-POP3(TASK)状态
-Router(TASK)状态
-SMTP(TASK)状态
-等待邮件数目
-死信数目
监控时间频度:对于部分监控频度要求较高的指标为5分钟采集1次、对于部分监控频度要求较低的指标1天采集1次(监控时间频度可以自行配置)。
◆应用方面
包括省公司、地市分公司在内的OA应用、邮件应用的监控:
应用监控的指标主要包括:
-定时代理激活状态
-数据库大小
-数据库是否损坏
-数据库视图文档量
-数据库索引大小
-数据库文档量
-数据库增长率
-文档文本域值大小
监控时间频度:对于部分监控频度要求较高的指标为5分钟采集1次、对于部分监控频度要求较低的指标1天采集1次(监控时间频度可以自行配置)。

应用监控一览页面
系统监控的其它功能点
◆对于性能指标超标、宕机故障,通过手机短信、邮件直接发送给OA系统的管理员、维护人员及其它相关人员,在报警信息中明确哪台主机、哪个Lotus Domino应用、故障发生的时间、初步定位的故障原因等重要信息,方便维护人员了解故障并及时解决故障。
◆实现了Mocha BSM系统跟OA系统集成。对于Mocha BSM中的预警、故障会直接触发OA系统中的预警流程、故障处理流程,这些流程会自动推送到OA系统相关人员的待办、待阅任务列表中。
◆Mocha BSM对OA系统的主机、平台、应用等各方面的过程和变化进行全面的跟踪记录,如系统运行状况、主机配置变化、Lotus Domino平台配置变化、应用模块变更等都会自动记录到系统中,非常方便查阅这些动态信息,做到了可追溯,同时这也符合SOX法案的要求。
3.2.2 报表展现功能
Mocha BSM系统对监控主机、平台、应用等方面收集到的数据提供了各种直观形象的图表和报表展现,提供了统计报告,提供了资源或指标走势,用以辅助分析和决策。
通过Mocha BSM提供的查询、统计功能、分析功能,客户可以统计1个月以来发生的故障次数以及解决故障的时间等等,作为提高维护质量的基础数据。
Mocha BSM能够根据历史数据对未来趋势进行预测,使决策更有依据。例如,能够根据磁盘每天的增长率来预测磁盘扩容的时间点,提前向管理员提示,为主机扩容提供依据,同时避免了人为的检查疏漏而磁盘空间达到临近100%产生的风险。

应用报表
3.2.3可视化监控
Mocha BSM 提供了主机系统和应用系统的可视化监控功能。当系统出现性能下降而需要去查找具体性能瓶颈时,客户可以使用可视化监控来实时地查看当前系统的所有性能指标,包括操作系统及应用系统相关的指
标都可以在一个页面中查看,而不用像以前一样再去分别查看和收集每个指标了。通过可视化监控的功能,可以直观看到当前系统的性能瓶颈,例如磁盘IO如果超出设定的阈值会以红颜色标出,而且页面上的动画也会加快转动的速度。
Lotus Domino平台的可视化监控也会在同一个页面中实时地展现出会话、TASK、数据目录、应用目录、常规信息等所有监控指标,帮助用户定位应用平台级的性能瓶颈。

可视化监控
3.3 技术架构
Mocha BSM系统设计中采用分层设计的方法,将整个系统划分为用户层、展现层、应用逻辑层、监控层、IT资源层。

Mocha BSM产品总体技术架构
3.4 实施方案
在本期工程中主要针对OA系统相关的主机、Lotus Domino平台、OA应用、邮件应用等进行管理、监控、分析。由于OA系统涉及到全省员工的日常办公,为了降低风险,实施过程分以下几个阶段进行:
◆测试
首先选择OA和Mail的测试开发机进行测试,在测试机部署Mocha BSM Agent进行试运行,在功能、稳定性等方面进行考察。OA和Mail开发测试环境稳定运行2周,在监控主机方面、平台方面、应用方面都获得了比较好的运 行情况。在测试期间,用户根据实际情况,对Mocha BSM进行了全面的测试、对一些配置参数进行了调整,对部分功能进行了细化。经过2周的测试,Mocha BSM满足了正式上线部署的条件。
◆上线
事先制定详细的工作计划、切实可行的实施步骤、全面的技术支持与服务。上线期间还分别对实施人员、维护人员、管理员等进行了培训。在上线之后,又观察了2周,在这期间内OA应用、Mail应用系统均运行良好。 3.5 运行环境
◆中国移动OA应用监控系统部署:
一台IBM P630服务器:部署Mocha BSM Server和Mocha BSM Portal。
一台IBM P550服务器:作为数据库服务器,存储Mocha BSM的监控数据。
在被监控的6台UNIX主机上分别部署Mocha BSM的代理程序,代理程序负责监控系统、获取各项数据。
◆用户端
操作系统:Windows 2000、Windows XP、Windows 2003
硬件配置:CPU主频200MHz以上、内存128M以上、硬盘300M以上
浏览器:IE 6.0以上
◆软件产品
Lotus Domino Client
Oracle 9i Database
Oracle Client
Mocha BSM Server
Mocha BSM Portal
Mocha BSM Agent for Lotus Domino
Mocha Alert
4、系统亮点
中国移动采用摩卡软件自主研发的摩卡业务服务管理(Mocha BSM)产品作为OA应用监控的解决方案。该方案解决了客户在实际工作中所面对的IT服务问题,该系统主要亮点如下:
◆系统将根据服务级别协议(SLA),为客户方便地定义符合其需要的各种指标阈值,通过具体的数字来量化地评价服务响应速度、故障修复时间等IT服务水平。
◆实时监控主机、Lotus Domino平台、OA应用、邮件应用等基础设施、应用等IT资源的运行状态、性能和可用性。
◆通过门户系统可以进行统一整合,实现单点登录SSO、统一授权和访问控制、集成展现和个性化等功能,使系统各模块之间实现无缝的协同工作,给IT服务经理、系统管理员、应用管理员等不同的用户群体和角色提供了可视化的工作平台。
◆当监测到系统故障时,快速定位故障的主要原因,估算系统事件对业务的影响及其严重程度,并触发相应的故障处理流程。
◆故障处理流程通过整合OA系统来实现,以短信提醒、待办待阅的报警形式实现系统流程的自动化。
◆提供了丰富的报表,提供了统计报告,提供了资源或指标走势,用以辅助分析和决策。
◆简单操作的系统管理配置,方便地配置所监控服务器的信息,应用数据自动获取。
5、摩卡业务服务管理(Mocha BSM)介绍
摩卡业务服务管理(Mocha Business Service Management),简称Mocha BSM,它基于ITIL(IT Infrastructure Library)的理念, 以实现用户端到端BSM为目的,倡导IT服务4+1的管理思想。
Mocha BSM采用了可视化的人机交互方式,不仅降低了IT维护部门管理维护的技术门槛,同时为用户的领导决策层、信息化部门领导等人提供全面、直观、图形化的数 据信息。通过业务流程管理这一核心支柱,实现基础架构管理、应用管理、端到端反应时间/事务监控以及端到端的BSM。

Mocha BSM 4+1的管理思想图
在基础架构管理方面,Mocha BSM提供了包括IT资产管理在内的各种IT基础服务的管理,包括网络设备、主机、操作系统,并提供整个用户的网络拓扑管理,通过摩卡可视化管理 (Visualized Management),为IT管理员提供一览式的主机运行状况报告。
Mocha BSM的应用管理,涵盖对各种应用服务器(包括Lotus Domino、WebSphere、Weblogic、SunOne 等)、Web服务器(包括Apache、IIS等)以及数据库服务器(包括SQL Server、DB2、Oracle等)
端到端的反应时间/事务监控,为用户的跨应用平台的事务提供监控,帮助IT管理员获取在各个应用阶段的事务反应时间,找出整个应用服务的瓶颈。
端到端BSM为用户整合不同监控系统的数据和事件,以清晰的仪表盘形式,展现各种指标状况和服务支持状况,最终帮助领导实现IT规划与决策。
规范化的IT服务管理,需要完整的流程支持,业务流程管理(BPM)的到来,帮助用户实现故障申报、故障解决、问题管理等IT服务管理的完整流程,最终记录完整的问题解决过程进入用户的知识库中,成为宝贵的知识资产。
著名分析公司Gartner Group推出了IT管理过程成熟度模型,将IT管理过程划分为以下5个阶段:

IT管理过程的5个阶段图
Mocha BSM 4+1的管理思想,希望帮助用户迅速摆脱混乱、被动的局面,最终达到“IT管理过程成熟度模型”的价值阶段。
6、客户收益和评价
目前Mocha BSM系统已经在中国移动正式上线使用且运行稳定。通过Mocha BSM对OA系统的监控、管理,彻底改变了IT部门维护OA系统的工作方式、解决了IT部门之前面临的种种问题。通过Mocha BSM的实施和使用:
◆从被动响应式的工作方式转变为主动服务,领导的问题,系统管理员能主动发现,而不是事后领导发现。
◆通过VIP服务,预防领导访问IT系统的问题,提高领导对IT系统的满意度。
◆通过端到端反应时间与事务管理及时发现问题,避免用户体验下降。
◆在复杂IT系统里,能够协助系统管理员快速定位问题和排错。
◆保护现有IT投资。
◆分析数据,展现报表,使公司领导更及时了解到相关信息。
◆使人员分工、IT预算等决策更有依据。
让我们来听听用户的心声:
“Mocha BSM产品,正是我们迫切需要的产品,它是先进的业务服务管理系统,提供了完善的自动管理、监控、统计分析等功能,现在IT部门的服务工作方式、工作内容有了彻底的改变”。