信息系统监理师学习笔记:第7章运行维护,学习经验大放送!
(1) 信息系统运维是指新建或升级改造类信息系统工程实施完成后的系统在完成其试运行周期后,正式进入生产环境交付使用阶段的维护和保养工作。(2)运行维护服务是指采用信息技术手段及方法,依据信息系统业主单位提出的服务需求,为其在使用信息系统过程中提出的各类需求提供的综合服务。(3)运行维护服务对象(简称“服务对象”)是指信息系统工程建设项目交付的内容,主要包括机房基础设施,物理资源,虚拟资源,平台资源,应用和数据等。运行维护服务能力的4个关键要素:人员,技术,过程,资源,每一个要素通过关键指标反映运维服务团队应具备的能力。运行维护服务能力模型:由策划,实施,检查,改进四个部分组成。每一个部分都有人员,技术,过程,资源四个要素,贯穿全过程的。- 调研评估。对运行维护对象的运行状况进行分析和评估,并提出方案建议。
- 响应支持。包括事件驱动响应,服务请求响应,应急响应。
- 优化改善。包括适应性改进,增强性改进,预防性改进。
为了满足与业主单位约定的运行维护服务需求,运维服务提供方需要根据不同的服务场景使用具体的运维工具开展日常运行维护工作。运维工具可分为过程管理工具,监控工具和专用工具,其功能覆盖运维服务流程管理,系统及硬件环境就运行状态的监控,信息安全防护,计算资源调度,自动化维护操作,服务数据分析,服务知识提炼,服务可视化等。为了实现有效管理运行维护服务活动所需的备件资源,按照SLA要求为所运行维护的设备或系统及时提供备件,运维服务团队需要建立备件库,保证设备或系统的正常运行。负责在个时间段,提供给用户或服务人员利用电话,邮箱,即时通信,网络或其他自动化手段,针对发生的事件,用户请求,变更等进行交流的途径。服务台是运维服务团队的重要组成部分,为用户和服务人员提供联络手段的同时,使用专门的工具进行记录并管理相关内容。运维服务团队应对运维维护工作相关的经验进行积累,形成可在运维团队内共享,可重复使用的知识和信息。结合信息系统现状和要求开展风险评估,从技术和管理等方面确定风险要素,制定应急响应预案,详细内容包括如下:- 对风险要素集训评估,形成风险评估报告,并对知识的风险形成应对措施;
- 应急响应预案可以分为总体预案和针对某个核心系统的专项预案;
- 应急响应预案的格式应该能够为应急响应组织进行系统恢复操作提供快速明确的指导;
- 应急响应预案要清晰,简洁,易于在紧急情况下执行,可使用检查列表;
运行维护服务根据其目标,工作内容,交付结果可分为四大类,详细如下:- 例行操作服务:是指运维服务提供方提供的预定的例行服务,为了及时获得运行维护服务对象状态,发现并处理潜在的故障隐患。
- 响应支持服务:是指运维服务提供方接到业主单位服务请求或故障申告后,在SLA(相关服务协议)的承诺内尽快降低和消除对业主单位业务的影响而执行的服务。
- 优化改善服务:是指运维服务提供方为适应业主单位业务要求,通过提供调优改进服务,达到提高运行维护服务对象性能或管理能力的目的。
- 调研评估:是指运维服务提供方结合业主单位业务需求,通过对运行维护服务对象的调研和分析,提出咨询建议或评估方案。