it运维实施解决方案书(精选4篇)
it运维实施解决方案书 第1篇
IT运维管理系统项目需求书
现状分析:
-应用系统和网络系统的日益复杂和庞大,维护人员面对的压力和挑战原来越大;
-目前的信息化管理没有遵循国际ITIL 标准规范,需要有标准的管理, IT部门就需要有一套完善成熟的并可管理的IT服务流程,遵循国际ITIL 标准,对IT运维进行有效地管理、使信息系统更加适应业务持续变化的需求、通过流程管理,不断提高IT运维质量,实现高效运维,提升组织内IT服务满意度。建立对IT基础架构的监控和搭建全新IT运维管理模式
通过管理人员、技术和流程的有机结合,实现IT运维管理标准化和规范化,立足于服务,建立以客户为中心、流程为导向、从业务角度出发的全新IT管理模式,建立快速响应并适应集团业务环境及业务发展的IT运维模式,实现基于ITIL的流程框架、运维自动化。让运营质量整体提高一个层次
1集中监控和基础数据采集
监控对象包含主机系统、网络系统、数据库、中间件、应用系统、存储设备、IT环境系统。监控对象的基础数据采集能够自动采集的全部使用自动采集的方式,并能够实现动态更新。被采集的信息在设备的生命周期内具有可追溯、可审计的能力。
-服务流程管理
应做到增加、减少和变更服务流程简单、便捷,各类用户使用统一的界面登录并提交任务。除了集中监控模块产生的事件自动转入指定流程进行处理外,其他任务由运维值班人员根据任务判断后启动规定的流程进行处理。
-知识库管理
知识库是运行维护中好的经验的总结和积累,是一个动态的过程,增删内容和审批由各级授权用户完成。
-服务台管理
指自动判断故障的类型,指派故障处理人员,记录系统运行过程中问题发生、故障解决和日常维护的全部过程,对发生的问题做到即时响应,建立系统运行维护量化的考评体系,统计分析体系,逐步提高服务水平和管理质量,并与相应的工作流程对应。
报表及统计管理。结合上述的各项功能,系统能够根据工作需要产生标准格式报表,并能够按条件生成和调整各类报表
预期收效
针对信息化部门IT异构化环境和工作复杂度低、重复性高及工作难量化、难考核特点,摆脱“救火队”的角色,变被动运维为主动运维,将人、技术、流程进行有效融合,从人员、系统、业务三维视角协助进行IT决策、业务运行健康度关联分析和运维管理人员的绩效评估;
从服务的角度去提高IT服务质量,达到服务质量和成本的双赢,实现日常运维工作的自动化、信息化和标准化,助力业务部门的信息化,实现推动IT业务运营的价值发展;
针对现有复杂的网络结构、不同的软硬件平台、繁多的业务系统,系统能够实现全面监控、分级管理、集中展现、提前预警、快速响应。系统建成后,在可控的费用与代价下,能全面提高信息中心“自主运维”能力、信息化管理水平,帮助持续提高业务部门和客户的满意度,为高效科学的业务运转提供有效保障。
运维管理平台能够面向信息网复杂的IT环境,整合各个专业管理系统的分割管理模式,通过运维管理平台,从业务和服务的角度,实现了对IT系统的集中、统一的运维信息化管理,系统借助ITIL等运维管理理念,达到了技术、功能、服务三方面的有机整合,实现了IT运维服务过程的标准化、流程化、规范化,提高了故障应急处理能力,提升了信息部门的管理效率和服务水平。系统体系结构
IT运维监控管理系统架构是一个层次化的结构。在不同的层次,有不同层次 的管理目标。可提供按照不同地域划分的分级分权管理机制。能够全面、正确、及时地反映被管系统的运行状态,提高运维的质量和效率,确保信息部门的技术支持服务以及信息化管理工作更为畅通、透明、完整和有效;同时,通过知识积累和知识管理,进而设定优化指标,进行量化管理,实现持续的服务改进;最终能够为业务部门和用户提供更高质量的服务并提高满意度,形成一个集中监控运维管理平台,以实现整个系统IT运维管理标准化和规范化。推荐品牌广通IT运维管理平台软件
推荐理由:
1、该产品紧紧依托公安部每年运维管理考核体系,随公安部考核标准做灵活变化,基本为公安系统指定网络运维管理软件;
2、公安行业二十多个省厅局使用。公安部、北京市公安局、上海市公安局、天津市公安局、重庆市公安局、陕西省公安厅、甘肃省公安厅、宁夏回族自治区公安厅、青海省公安厅、新疆维吾尔族自治区公安厅、新疆建设兵团公安厅、河南省公安厅、山西省公安厅、山东省公安厅、黑龙江省公安厅、辽宁省公安厅、吉林省公安厅、广东省公安厅、广西省公安厅、浙江省公安厅、海南省公安厅、湖北省公安厅、公安部消防局、公安部边防等;
3、陕西省公安厅及9个地市公安局(西安、铜川、延安、汉中、宝鸡、渭南、安康、商洛、咸阳)使用;
4、完善的本地化服务体系,在西安设立常驻办事处,两名技术支持工程师常驻本地,持续有效的为客户提供电话、现场服务。
it运维实施解决方案书 第2篇
企业IT运维从最初的基础架构管理发展到当今的IT服务管理,也即是业务系统管理,最终也将发展为运维流程化的ITIL服务管理流程。可见,企业的IT运维实施是一个循序渐进的,不断进步的过程,因此,各企业应该针对自身具体信息化水平决定应该选择哪种解决方案,而根据不同厂商的解决方案挑选出最适合自身条件的进行安装部署实施。
企业IT运维发展历程
自从信息化步入中国,企业的信息化建设就从来没有停止过,随着国家大力号召科学生产,提高企业的信息化生产水平,各大企业纷纷对信息化进行大量的投入,首先是部署硬件,构建企业局域网和控制生产线系统,从而实现自动化办公和流程化的生产管理。这些硬件设备的部署搭建了企业信息化的平台,而目前我国大多数企业也正处于这一阶段,相对的网络管理需求也比较简单,网络管理、桌面管理可以解决网络环境监控,设备管理以及终端用户的操作行为等。而企业信息管理部门只需要几个人就可以通过管理软件管控好全网的网络运行,保障企业的正常办公和日常生产。
当企业的业务发展日益扩大,需要进行系统化的流转时,这时企业就会上一些业务系统来构建企业全新的业务生产系统,而这些系统的正常运转关系到企业的生产效益和日常办公,而单凭网络管理和桌面管理是无法达到轻松管理的,企业需要的是能帮助信息部门管理好所有业务系统的管理系统。这时候应用管理系统,也即是业务管理系统就起到了关键作用。管理人员通过业务管理系统能将企业的各级业务系统分别进行监控,重要的设为高优先级,不重要的设为较低优先级,当有系统故障发生时,对于重要系统需要第一时间处理,而不重要的故障可以排队进行日常处理,
同时对一些设备故障也能进行等级评估,若其是支撑重要业务系统的设备,其造成的影响可能是巨大的,需要立即修复故障,而其他设备的故障则可暂缓修复。管理人员通过业务管理系统能够管控好企业的所有业务系统,进而服务于生产运作,这解决了企业信息化生产的需要,同时也为企业下一步流程化的IT运维奠定的基础。
随着业务系统和管理系统的增多,企业不再是仅仅依靠单个运维系统就能处理好运维了,而需要从全局进行系统管理,因此实施ITIL运维是企业IT运维的终极目标,也是实现企业持续性信息化增长的必要条件。选择一套适合企业现在的网络架构和管理系统的ITIL工具化平台成为CIO的终极目标,同时通过ITIL管理平台能带来全面的运维理念。首先在信息部门建立明确的运维流程制度,然后在信息部门和业务部门之间建立服务台,通过服务台解决业务部门的相关IT请求,最后是实现流程化运作,达到轻松、高效运维,提升信息部门的IT服务质量,实现了信息部门由成本中心向价值中心的转变,也从根本上提升了企业了IT运维水平。
企业选择合适的IT运维方案
总体说来,国内IT运维厂商众多,而广通信达则是其中一家能提供完整解决方案的国产运维领导厂商。广通有着多年的IT运维服务经验,其IT运维平台主要包括网络管理、桌面管理、应用管理和集中运行管理平台,系统架构清晰,采用层次化、模块化的设计理念:各功能模块功能独立、松散耦合,而整体系统功能覆盖全面,便于根据需求自由组合。 同时IT运维具有显著的开放性和持续发展能力,通过它的Probe插件体系和数据交换接口,可平滑的扩展系统功能并与第三方产品进行集成。
it运维实施解决方案书 第3篇
关键词:IT运维;IT资源统一监控;高校
中图分类号:TP393 文献标志码:B 文章编号:1673-8454(2015)21-0020-03
随着学校信息化建设的不断深入,各业务系统的技术支持和IT基础设施的运行维护已经成为学校主管领导、业务部门普遍关注的问题。这是一个随信息技术深入应用而产生的新课题。目前,国内许多高校的IT运维部门也都有从传统的、零散孤立的网络软硬件维护上升到基于业务、基于ITIL的IT运维服务管理层面的需求。本课题的研究和实施,也为IT运维服务管理的标准化、流程化和自动化在高校的应用实现进行了有益的探索。
一、高校运维现状分析
IT 运维理念是目前业界被讨论的众多热门话题之一。国内的IT运维系统也是多种多样,层出不穷,这些系统由于针对领域的不同其特征也各不相同。高校做为一个特别的群体具有网络设备的种类、数量多,网络环境复杂,业务系统应用广泛,涉及的品牌繁杂,部分服务群体(学生)流动性高等特点。所以至今还没有一款特别适用于高校的IT运维系统。但近年来,随着教育部“教育信息化带动教育现代化”理念的提出,高校信息化建设的深入和完善,保障校园网络环境、网络设备和各业务应用系统的稳定运行已经成为高校信息部门的头等大事,因为信息化的保障工作将关系到全校日常教学和工作的各个方面,一旦出现故障将对学校造成不可预估的影响和损失。
目前,高校的大多数IT运维部门仍使用传统的IT运维方法,这样存在很多问题,比如:
(1)服务器管理、网络管理、机房环境监控等系统相互独立,网络安全设备尚未有效监控,故障不能准确定位;
(2)系统配置信息散乱在各种资料中,关键信息登记不完善;
(3)由于历史问题,信息化设备登记混乱,缺乏管理;
(4)信息化运维效率较低,类似的问题经常发生,流程没有得到梳理,没有解决方法可以借鉴;
(5)对IT运维人员技能要求较高,运维人员工作考核无法量化。
这些问题虽然迫在眉睫并受到足够地重视,但远未得到有效地解决。因此我校数字校园建设中心计划在现有IT基础上通过进行问题梳理,建设一套基于ITIL的IT运维服务管理系统。重组业务流程和变革内部管理流程,实现IT技术和主要业务的整合,从而使信息化手段成为支持业务运作的强大动力,这也是近年来越来越受到关注的IT运维服务管理所要达到的目标。
二、IT运维服务系统的功能需求分析
通过对以上问题的分析得出需要搭建运维综合管理平台,在现有服务流程评估分析基础上,对照ITIL标准,进行差异分析,改进和建立缺失的流程,完成IT运维流程梳理与设计。根据实际工作需求和ITIL最佳实践,设计一套符合实际应用、完整和规范的服务流程与运维管理平台。要求覆盖高校所有信息化运行、维护、服务管理的业务。
需要搭建能够统一全面监控所有信息资源的监控平台,具备基于三层路由协议的网络发现和拓扑呈现能力,多协议物理和逻辑拓扑发现和呈现能力,全方位网络设备、中间件等 IP 基础设施、基于数据库和Web Service 接口的应用层中间件自动发现及监控。
需要搭建告警信息采集平台。该功能应该具备单位时间内对网内的设备、系统进行轮询,实时监测可能发生的问题。在问题发生的第一时间快速响应,并对问题做出分类,不同问题给出不同的相应级别,通过邮件、短信等方式通知相关运维人员。较快速的解决问题。存储并对问题进行分析,供相关人员决策。
系统应具有审计日志、错误日志、管理员日志和操作者日志等功能,并对日志内容进行相关保护、分析和呈现。支持对IT运维服务各类业务进行统计,提供多种组合条件(事件次数及分类、用户数量、使用时长、常用功能等)的查询、统计。以即时或指定时间段为周期,形成业务统计报表。
三、IT运维服务系统的构思与落地
1.系统架构设计
通过对系统建设需求和应用模式的分析,对总体架构进行了分层设计。系统采用了四层体系架构,系统的四层体系架构自上而下分别是展示层、逻辑层、配置层、管理对象层。展现层包含了系统应用程序中需要和用户交互的组件。是系统功能实现、人机交互的窗口;逻辑层是实现系统所有运维业务管理功能的支撑,是基于配置层定制的满足IT运维业务需求各种流程的管理应用,由事件管理、问题管理、配置管理、项目管理、变更管理、服务台等业务流程模块,同时具备系统管理员入口功能;配置层为业务系统提供开发运行环境,将采集到的海量数据进行全面核查 ,在核查的基础上对确实数据进行预处理和标准化处理;管理对象层是对数据采集的全过程进行控制,并对采集的数据进行加工处理,从而实现各种异构信息产品和运维事件的信息收集,预警和告警条件的触发,为系统提供数据基础。
2.系统功能设计
系统采用B/S模式,在现有的校园网平台基础上,实现对IT运维服务全方位管理。系统的功能结构设计如图1所示。
系统功能结构划分主要是根据系统需求分析、功能定位和方便易用的原则进行设计。本系统五个组件主要完成以下功能:一是系统IT资源统一监控管理功能;二是系统安全和告警管理功能;三是系统自身管理和系统日志管理功能;四是统计分析管理功能;五是运维服务综合管理功能。系统采用整体设计、分步实现的原则。
(1)IT资源统一监控平台
1)网络拓扑自动发现
网络拓扑自动发现需要满足:准确性、实时性、完整性、低负载的要求。需要支持维护人员手工修改拓扑图。最后决定在自动发现的过程中,优先使用各个厂商提供的专属拓扑发现协议。
2)网络拓扑前台配置与展示
拓扑配置与展示在系统中占有非常重要的地位。网络管理系统中的拓扑图展示将包括如下要素:
背景图:可先把众多网络设备分为多个区域,如果某个区域出现告警,则这个区域的代表图标进行告警提示;另外,一些不方便用动态图形展现的静态信息,比如文字描述,静态连线,特殊标识等,也可以放在背景图中;
节点:作为被监控设备的数字化代表,每种被监控实体都会有属于自己的图形标识,每种类型的被监控实体,如主机、数据库、路由器等图形标识不同且容易区分记忆;
连线:在网络中,各个被监控实体都不是完全独立的,拓扑展示中需要表现出各个实体之间的连接关系。
(2)告警和系统安全管理
1)告警信息实时采集
设备关联和告警信息的自动传达,支持接收网络设备所发出的SNMP TRAP、Syslog日志告警,能实时的监测网络物理链路的情况、核心机房网络出口设备的异常情况,并判断是否为异常情况进而触发告警模块,可以根据告警事件的轻重选择告警方式,匹配不同级别的告警信息,如流量超过一类阀值为一般告警,超过二类阀值为紧急告警等细致化功能。
2)系统数据备份
对故障的采集、分类、展示是整个模块的核心功能,也是所有模块共同工作所围绕的中心点。首先通过采集模块对系统信息进行收集,通过各种对应的采集接口传回采集主机。然后由采集机上相应功能模块进行数据检错、过滤、分类,并把数据入库。然后,前台展示程序把分类入库的告警数据等做集中展示,并统计出相应报表。
除此之外,告警信息的过滤、压缩,故障定位及联动,系统审计,数据的展示也是系统设计要考虑的重点。
(3)系统日志管理和统计分析管理
面向领导、运维部门主管、运维人员提供网络和业务系统的运行状况分析,进行运维人员的绩效考核及其他相关的统计分析,为领导决策提供相关依据。保存过程中的所有日志文件,并进行分类。支持多重身份的验证。比如:业务关系流程图、设备位置分布图、网络结构拓扑图、流程进度时序图、工作日历、任务冲突分析图等,要有优质的操作体验。
(4)运维服务综合管理
运维服务综合管理要首先对业务流程进行梳理,将梳理的结果进行重定向。运维服务综合管理模块应具备友好的流程设定功能,利用图形化的方法快速部署。支持需求出发的流程环节快速重组,并根据需要进行增删改操作及对流程的执行进行监控。实现实时服务监控和绩效评定。系统中内置关键绩效指标信息,提供必要的绩效考评手段。自由扩展数据属性,提供表单的自定义相关功能。根据实际需求定制符合要求的表单,使表单的信息更加标准化、规范化。
3.系统安全设计
系统安全是保护系统的软硬件不受偶然的原因或恶意的攻击行为而遭受运行中断、数据被更改或破坏。
(1)系统硬件和网络环境安全
将系统接入到学校数据中心机房的内网服务器群区。有防火墙和其他安全保障措施,可以保证网络安全和服务器安全。
(2)角色权限控制
系统支持多角色,但对角色做了严格的权限控制,不仅对系统功能模块做了权限控制,对设备访问权限也做了控制,保证每个用户只能看到自己管辖范围内的资源,访问权限内的系统功能。
四、系统测试
1.功能测试
功能风险识别主要是两方面,首先目前定制的功能是否满足前期需求;其次,现有功能是否存在技术上的问题。验证与需求的一致性、系统的稳定性、安全性和可扩展性等。
2.流程测试
对运维服务综合管理模块的业务流程进行风险识别,从用户、运维人员、系统管理员、决策者等角色进到系统中,从具体业务流程出发,检验平台的业务流程是否符合实际业务流程,是否符合具体业务要求。
3.性能测试
性能风险识别是通过测试工具模拟多种正常、峰值及异常负载条件来对系统的各项性能指标进行识别。
依据项目风险识别方法,通过上述识别过程,经测试,系统功能、流程、性能已基本规避相关风险,能满足平台要求。
五、实施前后效果对比分析
系统实施前后效果对比如表1所示。
六、 结束语
本文通过对当前基于ITIL理论的IT运维服务管理系统的分析,指出IT运维服务对于高校信息化建设的意义。为高校信息化的管理提出了构建从 IT 基础架构管理面向业务管理的总体思路,从业务视角洞析 IT 管理的全过程,为业务的正常运作提供了强有力的保障,提高服务对象的整体客户满意度。
参考文献:
[1]凤羽翚,李严锋,叶琼伟编著.业务流程管理[M].北京:北京交通大学出版社,2009.3.1.
[2]王东红.信息系统运维基础[M].北京:北京理工大学出版社,2012.7.
[3](德)希尔等著,黄官伟,武亚平译.下一代业务流程管理:ARIS与SAP应用案例[M].上海:同济大学出版社,2007.7.1.
[4]麦斯阿塞克著,马素霞等译.需求分析与系统设计(原书第三版)[M].北京:机械工业出版社,2009:18-26.
[5]周凤珍,彭勇主编.信息运维人员胜任力模型研究[M].成都:四川大学出版社,2012.7.
[6]程栋,刘亿舟编.中国IT服务管理指南(第2版)[M].北京:北京大学出版社,2012.
IT运维监管控一体化解决方案 第4篇
IT运维管理闭环体系
2010-11-17
本文论述了IT运维监管控一体化趋势,建设要求、原则,方案整体设计和具体实现。
IT运维监管控一体化解决方案
目 录
1.2.3.4.IT运维服务管理概述......................................................................................................5 IT运维管理一体化管理解决之道..................................................................................6 IT运维一体化建设目标..................................................................................................6 系统设计原则...................................................................................................................7 4.1.4.2.4.3.4.4.4.5.4.6.4.7.4.8.5.系统的先进性.......................................................................................................7 系统的实用性.......................................................................................................7 系统的有效性.......................................................................................................7 系统的可行性.......................................................................................................7 系统的可靠性.......................................................................................................8 系统的开放性.......................................................................................................8 系统的扩展性.......................................................................................................8 系统的安全性.......................................................................................................8
IT运维一体化平台建设原则..........................................................................................8 5.1.5.2.5.3.5.4.5.5.5.6.统一规划...............................................................................................................8 转变观念...............................................................................................................9 分步实施...............................................................................................................9 可插拔模块化.......................................................................................................9 有所为,有所不为.............................................................................................10 不唯美,而唯实.................................................................................................10
6.IT运维一体化解决方案................................................................................................10 6.1.6.2.6.3.6.4.6.5.理解IT运维一体化...........................................................................................10 监视模块建设.....................................................................................................12 流程管理模块建设.............................................................................................12 自动化操作模块建设.........................................................................................13 CMDB建设........................................................................................................14 6.5.1.CMDB战略核心地位...............................................................................14
/ 28
IT运维监管控一体化解决方案
6.5.2.CMDB建设方法.......................................................................................15 6.5.3.CMDB建设保障.......................................................................................16 6.5.4.构建CMDB模型......................................................................................17 6.5.5.避免CMDB建设误区..............................................................................18 6.6.模块之间接口实现.............................................................................................18 6.6.1.监与管之间的接口....................................................................................18 6.6.2.管与控之间的接口....................................................................................19 6.7.7.报表系统.............................................................................................................19
IT运维一体化特点........................................................................................................20 7.1.7.2.7.3.7.4.7.5.7.6.7.7.监管控一体化整合.............................................................................................20 层级化展现平台.................................................................................................20 综合事件管理平台.............................................................................................20 全方位IT资源管理平台...................................................................................20 面向基础设施.....................................................................................................20 面向维护管理者.................................................................................................20 面向领导决策者.................................................................................................21
8.IT运维一体化系统功能................................................................................................21 8.1.8.2.8.3.8.4.8.5.8.6.8.7.8.8.8.9.信息门户.............................................................................................................21 事故管理.............................................................................................................21 问题管理.............................................................................................................22 变更管理:.........................................................................................................22 发布管理.............................................................................................................23 配置管理.............................................................................................................23 工单管理.............................................................................................................23 作业计划.............................................................................................................23 值班管理.............................................................................................................24
8.10.考核管理.............................................................................................................24 8.11.代维管理.............................................................................................................24 8.12.知识管理.............................................................................................................25 8.13.安全管理.............................................................................................................25
/ 28
IT运维监管控一体化解决方案
8.14.服务持续性管理.................................................................................................25 8.15.容量管理.............................................................................................................25 8.16.可用性管理.........................................................................................................26 9.总结.................................................................................................................................26 9.1.9.2.IT运维管理内容层面........................................................................................26 IT运维一体化优势............................................................................................27
/ 28
IT运维监管控一体化解决方案
1.IT运维服务管理概述
随着企业信息化程度的提高、IT环境规模的扩大和IT环境复杂度的增加、行业内服务竞争的加剧,如何保证IT系统安全稳定运行,为业务提供可持继性的支撑,最优化IT环境的性能,有效控制IT成本和计划IT投资,这些都对IT系统运行维护支持以及IT服务水平提出了新的要求和挑战。
面对的挑战:
越来越高的服务成本 以流程管理为驱动的转型阶段 从以“技术为中心”向“业务驱动”的转型 服务协议成为最佳成果的代名词
合作伙伴关系将替代“客户-供应商”的简单关系 服务成为应用的代名词
信息技术在业务中起着越来越重要的作用,越来越多的业务流程依赖IT技术。从技术和业务的双重视角对其进行有效管理,保障业务处理平台高效、安全、正常运行,为业务服务提供有力支撑成了运维人员和IT部门的常态工作。
如何在企业内部建立起一套有效的运维交互平台,理顺不同部门以及上下级之间的协作关系,规范工作流程,提高工作效率,实现故障处理、资源调度优化、系统割接、业务保障等运维工作的闭环流程监控和管理,是目前各IT运维部门关心的问题。
/ 28
IT运维监管控一体化解决方案
但是,由于业务快速变化、用户环境日益复杂、IT应用日益繁多等因素导致了IT服务与实际业务需求脱钩,IT服务与业务部门的实际要求出现鸿沟,由此催生了面向“IT服务”的管理挑战与需求―――IT服务管理。IT服务管理立足于服务,建立以客户为中心,以流程为导向,从业务角度出发的全新的IT管理模式,通过整合IT 服务与业务,提高了组织对外提供服务的能力,是真正实现这种服务管理的有效途径,能帮助用户最终实现IT与业务的融合。
2.IT运维管理一体化管理解决之道
受习惯、时间、财力等诸多因素的影响,在迈入IT服务管理过渡阶段过程中,大多数客户的IT服务部门管理的变革没能跟上技术的发展,未对IT服务管理进行整体规划,没有导入适合现阶段的管理机制,依然沿用“被动响应、救火队”服务支持管理模式,依然缺乏适用的自动化管理流程,导致IT服务管理能力低下。
IT运维一体化平台依靠对复杂异构的IT资源环境(网络设备、安全设备、服务器、存储、机房环境、操作系统、数据库、中间件、业务系统、IT资产、日常工作、外包管理......)的一体化监(面向业务服务的监视)、管(面向运维流程的管理)、控(面向日常运维的控制),最终达到保障IT基础架构稳定可靠运行、降低系统和业务应用宕机风险、提高运维支持和服务管理效率、优化运维流程、建立绩效体系、控制运维成本、改进决策过程的目标。
3.IT运维一体化建设目标
IT运维一体化平台的总体目标是建立一个稳定、高效、灵活的IT运行和维护管理体系,涵盖IT运维工作中的监、管、控三方面,为业务应用正常运行提供有力的支撑,提高信息系统运行效率,提高服务质量,降低运营的成本。
实时管理:及时发现故障与异常,并迅速定位,尽快解决;通过运行分析,调整运行策略;通过业务系统性能的测量和管理,优化系统性能,提高系统运行效率。 闭环管理:通过科学规范化的流程管理保证故障、异常、隐患由相应的人员采用必要的方式闭环处理;促进巡检、变更的工作标准化、规范化;通过流程运行的考核数据,促进运维质量和运维效率的提高。
精益管理:通过丰富完善的报表和图档资料,为运行维护工作提供直观准确基础数据;避免维护工作中的疏漏而带来的人力、资金浪费;分析信息基础设施的运行负荷,制定合理的资源调配方案。
/ 28
IT运维监管控一体化解决方案
战略管理:优化现有的IT基础设施的运行性能;提升系统性能;预测并计划信息基础设施的需求;考核并不断提升服务水平。
4.系统设计原则
4.1.系统的先进性
先进性是每一个IT系统建设不断追求的目标。随着IT技术的迅速发展,更新的、更先进的技术和思想总是在不断出现,因此,系统设计必须兼顾先进性。
系统规划的先进性是将系统看成一个有机的整体工程,不但在规划时要考虑到它的目前现状,还要考虑它的发展和未来。不论硬件或软件,在应用目前相对成熟的技术基础之上,系统必须能够不断完善、扩充,功能越来越丰富,尽可能小的代价来适应系统需求的不断增长和技术的不断发展,使现有系统能够与IT运维需求同步增长。
4.2.系统的实用性
IT运维一体化平台建设能否成功,实用性非常重要。系统设计必须以实用为出发点,而不是一味追求新技术、新理念和照搬国外模式。IT运维平台是为IT环境支撑提供运维管理的基础。要达到实用性的要求,必须设计时充分考虑到国内情况、本行业特点和本企业实际状况,充分明确:提高自身的IT运维管理水平和提供更好的业务服务能力才是IT运维管理平台建设的根本目标。
4.3.系统的有效性
IT运维管理系统是IT部门每天工作的基础和平台,是IT部门的根本。如果不具备有效性,华而不实,很难设想IT部门如何开展工作,如何实现有效的IT运维管理,更无法谈论提供高质和高效的IT服务。
4.4.系统的可行性
IT运维的理念和设计规划再好,如果不具备可行性,也只是空中楼阁。因此,必须考虑系统建设的可行性。可行性的考虑包括:目前技术上是否可以实现、自身人力、物力和财力上的支撑。
/ 28
IT运维监管控一体化解决方案
4.5.系统的可靠性
IT运维系统的重要性不言而喻。如果IT运维系统运行故障而停止工作,那么企业的IT环境犹如没有控制盘的汽车,处在无序、惯性行驶的状态。此时,IT环境对于IT运维人员而言,完全陌生,处于隔离、未知、失控的状态。
对于IT运维管理系统,监控的失败或瘫痪相当于人失聪、失明,流程管理的失败相当于大脑丧失了思考能力,自动化运维操作的失败相当于截肢瘫痪。因此,任何模块的失败,后果都是严重的。IT运维系统本身的健壮性、自身完善性、稳定性是至关重要的。
IT运维平台是企业IT环境中实现正常运维工作的基础和管理平台。因此,IT系统建设一定要考虑系统的可靠性。
4.6.系统的开放性
IT技术发展日新月异,IT系统的开放性和标准性越来越成为一种趋势。只有采用开放的系统,使用开放的技术,才能保证整个系统有持久的生命周期,才能长期保护企业在IT运维的有效投入。例如:接口之间采用Corba,xml,jdbc,ftp,jdbc等开放技术。
4.7.系统的扩展性
随着IT业务系统的增加和IT环境规模的扩大,随着时间的推移和情况的变化,无不需要考虑系统功能的变化和调整。因此,IT运维一体化平台系统需要具有很强的扩展能力和适应能力。
4.8.系统的安全性
基于IT运维管理系统的角色,IT运维系统的安全变得至为关键。很难想象,IT运维管理系统由于病毒或者安全入侵,导致IT运维平台瘫痪带来的后果。
5.IT运维一体化平台建设原则
5.1.统一规划
IT运维一体化建设中必须坚持统一的规划、明确的发展方向和思路,在全局、宏观上做到统筹安排,合理规划。实施对整体架构和数据模型的统一管控。
/ 28
IT运维监管控一体化解决方案
5.2.转变观念
任何生产活动都是人来主导的,IT运维管理体系的建设不单是一个软硬件系统的建设,还是一个运维团队和人文的建设。IT运维一体化平台的建设,是IT运维理念和管理上的一次划阶段的变革,它需要整个IT运维部门的文化、体制和思想也要作相应的转变和调整才能成功。根据以往情况,企业的IT部门往往都是技术至上的工程师文化,而这种源于研发企业的文化和现今IT管理部门作为业务支撑部门的定位严重不符。因此,完善IT服务管理的过程,也必然是部门文化和IT运维理念和体制转变的过程。在建设IT服务管理体系的过程中应遵循以下2个原则:
高起点,借鉴业界先进的管理模型和方法。
重执行,任何管理规范和流程的制定都要以可执行,可考核为前提。
5.3.分步实施
IT管理体系的建立和完善不可能一蹴而就,需要有长期的计划步骤实施,必须循序渐进,遵循分阶段和迭代实施的原则。
横向扩展:从个别的业务系统扩展到所有的业务系统,规模上逐步从小到大。 纵向加深:功能上逐步完善、丰富和细化,模块和子模块数量从少到多,从有到优。 制定计划,“有重点、分阶段”展开。
5.4.可插拔模块化
IT运维一体化平台涵盖了IT运维工作的各个方面,从全局到局部,从宏观到细节。系统架构设计必须以模块化为基础。
必须平衡考虑系统内部模块的松散性和耦合性。作为同一平台内部的模块,由于相互协作,模块和子系统之间必然存在着耦合性。另一方面,为了控制单点故障带来的对系统整体的影响,必须有效控制单点故障后所影响的范围并在此基础上才有可能提供快速恢复的能力。
模块化为可插拔性提供了可能,使得系统设计上可扩展性原则得以实现。 可插拔化:为模块的升级、优化和采用新技术,提供了实现的前提。不同组件、不同层面的模块的替换,对系统的其他模块是透明的。局部的调整和升级并不对系统的整体架构产生必要的调整。
/ 28
IT运维监管控一体化解决方案
5.5.有所为,有所不为
在一个阶段,不求大、不求全。求大求全,则难以有所为,必然陷于被动。必须明确,有所不为而后可以有为。
5.6.不唯美,而唯实
过分追求完美,会导致华而不实,会导致系统本身和建设上的虚、浮、躁。只有尊重实际情况,才能脚踏实地,步步为营,有效推进IT运维管理工作的建设并不断提高。
6.IT运维一体化解决方案
6.1.理解IT运维一体化
针对IT运维,我们划分为三个方面,监视、管理和控制。“监、管、控”三者紧密关联,逻辑上是一条龙过程,并形成闭合环路。
监控的结果作为依据来分析、决策和指导IT运维工作的进行;IT运维工作本身需要流程管理来进行规范和控制;自动化运维操作将运维工作中大量、重复的劳动来批量控制,自动完成,节省人力,并提高效率。运维工作的质量和结果需要监控来进一步实现观察和确认,以判断是否符合工作预期,必要时,再次调整和提高。
可以说,监视是我们的眼睛,帮助我们透视和认清网络、主机、应用等整个IT环境,是我们的情报来源;流程管理是我们的大脑,帮助我们思考、制定决策和完成流程控制和管
/ 28
IT运维监管控一体化解决方案
理,是我们的情报分析和决策中心;控制是我们的双手,完成自动化批量处理,是我们的实施力量和手段。由此,我们说,“监、管、控”,这是有序的一条龙过程。
双手完成运维处理和控制动作之后,我们需要眼睛再次监视,来查看控制结果。继而,需要大脑来审验:是否符合预期?是否需要进一步调整和控制?如是,进而开始新的“监管控”流转过程。由此,我们还可以说,“监、管、控”,这又是一个闭合的环路过程。
IT“监管控”一体化运维,就是真正实现上面的一条龙过程和达到闭合环路的目的。在IT“监管控”一体化运维模式下,当监控管理模块发现故障并产生告警后,如满足相应的过滤和触发条件,通过接口会自动触发运维流程管理模块生成相应的工单,运维流程管理模块依据工单信息和相应运维人员预先设置好的关联条件,自动寻找、识别和匹配自动化运维模块中的操作脚本,实现自动和快速的故障操作处理。由此实现从发现故障到解决故障的IT运维全自动化,并自动完成运维操作日志记录,以备事后回顾和审计。
IT运维自动化不是IT运维工作简单的维护过程的改变,而是IT运维管理工作的根本变革,是IT运维管理的发展趋势。
在IT“监管控”一体化的运维平台中,原来的网管监控、运维流程管理和自动化运维操作平台转化为对应的“监、管、控”三个模块。
IT运维一体化平台应在设计之始即充分遵循ITIL理论,并结合国内现状、行业特点与实践经验,建立以服务流程为驱动的管理平台,实现人员、流程、技术三方面的完美结合。唯此,才能够在帮助用户深耕基础架构、夯实基础之后,与用户一起建立遵循先进流程管理思想的ITIL理论、实现以服务流程驱动为导向的实用的“人管流程”。IT运维一体化平台为用户带来“IT管理理念+系统工具+过程方法”的全新的IT服务管理组合,为用户提供包括管理流程与规范、业务及实施方法在内的全方位IT运维服务管理一体化解决方案。
IT服务管理的最终目标是实现业务与技术的融合,IT运维一体化平台紧扣业务部门与IT部门融合要求,提供业务与技术沟通和连接的平台,将业务部门与IT部门紧密结合在一起,能够帮助用户持续提高业务部门和客户的满意度,为客户的IT服务管理做出贡献,提高用户的核心竞争能力。
实施IT运维管理一体化可以帮助企业将IT系统原来的混乱状态变到主动的管理状态,包括将技术导向变为流程/服务导向,将被动处理变为预防为主,将孤立、分散系统变为集成化的系统等等。
总之,IT运维管理一体化通过将人才、流程和工具技术进行有机结合,实现高质量、高可靠性的IT服务服务管理。
/ 28
IT运维监管控一体化解决方案
6.2.监视模块建设
IT监控内容:网络设备、链路、主机操作系统、数据库、存储、中间件、应用软件、业务服务、机房环境(温度、湿度)、机房门禁等。
通过IT网管监控,可以帮助运维部门和人员实现全天候自动检测,可以及时、快速发现故障,通过事件关联分析,并结合问题管理,实现快速定位故障根源、快速预防和恢复,从而提升IT运维响应能力,变被动式管理为主动式运维,使IT运维工作从事后“救火式”管理转变到事前预防型管理。
6.3.流程管理模块建设
IT运维管理涉及的对象包括设备、技术和人员。其中,人是IT运维生产力决定的因素。如何有效实现设备、技术和人员的统一管理,如何实现人的组织和行为的科学化和规范化,需要IT运维流程管理。
IT运维工作本身具有工作量大、全面、繁琐和复杂的特点,通过有效的IT运维流程管理平台,既可以梳理工作流程,又可以理顺部门之间和人员之间的职责关系,达到标准、规范、统一和科学的运维,保证IT运维工作无论是整体和全局,还是细节和局部,都能有效推进,避免IT运维工作的无序和混乱。
/ 28
IT运维监管控一体化解决方案
IT运维流程管理通过建模,提高流程的可控性。同时,IT运维流程管理提高IT运维管理和执行工作的透明度。传统手工运维流程的不可控性和不透明性给流程定制、管理和优化带来相当大的困难,而IT运维管流程管理可以帮助IT运维部门一目了然地看到整个流程的全局和各运维工作节点的状况。
通过标准化的IT运维流程管理,可以不断提高IT运维工作质量,提升企业内外的IT服务满意度。
电子运维流程管理系统定位于通过电子化手段来确保运维工作的流程化、工单化、自动化和信息化,实现对流程的实时监控与闭环管理。
6.4.自动化操作模块建设
在IT运维工作中,存在着大量和重复的劳动,如补丁安装、合规检查、配置收集、日常巡检等。计算机的一个重要特点,就是可以帮助人类完成大量的、重复的劳动。自动化运维,就是人类在IT运维工作中具体操作层面的计算机化。
通过自动化运维:
实现批量处理,高效、快速工作; 节省人力,降低人力成本;
/ 28
IT运维监管控一体化解决方案
将有限的IT运维人员解放出来,避免大部分时间和精力是处理简单的、大量的、重复的问题和工作,而是更多时间和精力关注如何提高和保障IT运维; 技术知识和操作脚本共享,运维操作精确化、同质化、优质化、规范化、统一化,避免运维工作中操作质量依赖于个体人员的知识、技术水平、工作责任心和态度等不可控因素;
实现转变:以前运维工作更多依赖于“运维英雄”和埋头苦干型员工,现在更多依赖于运维集体的力量;
交由计算机操作,可以避免人工误操作导致的逻辑错误;
实现运维操作简约化、透明化、规范化、标准化,有利于事前审核和事后检查。
6.5.CMDB建设
6.5.1.CMDB战略核心地位
作为ITIL/ITSM(IT服务管理)的核心,CMDB正从管理软件附属品的地位逐渐走入主流的战略核心地位。
企业的IT环境越来越复杂,数量庞大、品种繁多。信息散布在企业的不同地方、不同系统中,而且信息的格式、内容也是千差万别,难以统计、查询、利用这些信息,由此给使用、更新、维护、优化等管理工作造成了很大的麻烦,如何快速提供准确的配置信息是一个重大的挑战。
CMDB储存与管理企业IT架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,一方面支持这些流程的流畅运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。CMDB常常被认为是构建其它ITIL流程的基础而优先考虑,ITIL项目的成败与是否成功建立CMDB有非常大的关系。
CMDB是描绘IT基础设施如何构建的一个蓝图,它记录了各种各样的配置项(即硬件、软件、事故、协议、服务级别、文档、部门、人员等资源)是如何相互关联的、以及各个系统是如何发挥作用的。
CMDB与传统的资产库有着根本的差别。资产库是一个存储企业所有资产的数据库,而CMDB不仅仅存储所有IT元素,更重要的是可以展示它们之间的相互关联,从而帮助企业了解IT资产的运行状态是什么样子,它对企业业务有什么影响等。
/ 28
IT运维监管控一体化解决方案
IT环境视图清晰地展现了各种IT设备、其属性以及相互关系;业务视图可以让每个人员明确,业务运作模式是什么样,不同业务关联到哪些设备,每个设备的故障影响到哪些业务等。
6.5.2.CMDB建设方法
CMDB是一个特殊的数据库,它必须拥有4个至关重要的功能:
联邦性:是指CMDB能直接获取多种数据源并与数据源联系在一起; 协调性:能够避免重复,并对来自不同数据源的配置项进行自动匹配; 同步性:即确保整个系统中的信息是同步更新的; 可视化:即可提供配置项(CIs)的端对端及层次化视图。
CMDB有两种,一种是物理的数据库,要求客户把全部配置项都拷贝到物理数据库里面去;另一种是虚拟的数据库,如MO的CMDB,不要求客户把全部配置项都拷贝到物理数据库里,只维持关联关系就可以。
物理型CMDB数据库:存在两个问题:其一,不同数据库中的数据要全部无冗余地拷入CMDB,存在一定困难;其二,不同数据库中的数据也是不断地更新,要想同时把变更之后的数据传递给物理型CMDB,会带来网络流量方面的问题,也很难做维护。
虚拟型CMDB:通过指针索引的方式去获得其他数据库里的配置项信息,不存在以上两个问题。但是,虚拟性CMDB需要人工梳理和比对大量的关联关系,并不断更新。
CMDB通常采用三种实施方法:自上而下、自中而上、自下而上。每种方法对现有配置数据的实施要求在范围和程度上都不一样。
自下而上的方法:也就是从底层开始,首先查找企业内的所有CI(配置项),着手建立一个大的数据库,然后查找CI之间的关联关系和对业务的影响。这种方法往往要花几年时间才能完成。
自上而下的方法:就是从小的局部系统开始实施,比如信贷核心系统,从这个业务开始着手,然后把底下与此业务相关的所有IT元素全都关联过来。这样的好处是可以在比较短的时间内即一个月做出一个完整的CMDB,而不需要花若干年。 自中而上的方法:就是采用折中方法建立CMDB,它是通过在企业建设过程中,将逐步形成的分散的、独立的、自身需要的信息资源库在CI层面上进行逻辑联邦和同步,建立起虚拟的CMDB。
/ 28
IT运维监管控一体化解决方案
自中而上的方法,可以帮助用户在短时间内建立起企业内需要的CMDB。CI信息全面,同时见效快,既避免大规模的CMDB建设的时间长、见效慢的缺点,也避免了单点突出建设CMDB的CI范围狭窄、完整度不足的缺点。
具体建设CMDB时,需要从两个层面来实施:
一是采集基础数据。要通过适配器把数据采集上来,然后放到一个大的数据库中。
二是建立业务视图和业务影响分析。业务视图反映业务流程运作的情况是不是正常,有没有问题等。这需要按照业务性质、业务流程等建立模型。
通过建模工具,建立描述业务流程的树状模型,模型上的每个结点上把每个配置项(CI)的影响以及相互影响放在上面,一旦某个配置项出现问题,图上就可以实时反映出来。为了建立业务视图,IT部门需要得到业务部门的大力支持。
6.5.3.CMDB建设保障
企业在实施ITIL项目的时候,配置管理常常被视为项目的软肋,费时费力,却事倍功半。究其原因主要是因为企业在建设CMDB(配置管理数据库)的时候,往往不知所措,耗费了大量的人力和时间收集各类IT基础架构信息,最后得到的却是一个极其复杂而难以维护的“IT基础架构信息库”。这与ITIL描绘的配置管理是企业实践IT服务管理的基础或核心,为ITIL其它流程提供基础信息的关键地位相去甚远。正确来构建CMDB,必须有如下保障:
制定配置管理政策
IT运维管理政策,是指导和规范IT运维管理的行动指南和共同纲领。它使企业在认识上形成统一,减少了不必要的沟通成本,并使企业在流程执行上事半功倍。对于构建CMDB而言,主要有以下两类政策:
宏观政策,主要是涉及公司或IT部门层面指导性、方向性的政策,其目标是在企业内部形成统一认识。如:企业IT内部应当使用统一的配置管理流程,并且使用标准的文档记录和汇报机制。
运营政策,主要涉及到流程目标、人员、输入、输出、活动以及KPI(关键绩效指标)等各要素以及流程之间相互协调、信息交互方面的指导原则,其目标是使流程能够在政策的指引下稳健、有效地执行。
确定配置管理的范围
/ 28
IT运维监管控一体化解决方案
政策的制订定为企业构建CMDB营造了良好的环境,配置管理范围的确定才是企业构建CMDB的真正开始。配置管理的范围主要指的是CI的宽度和深度,以及CI的生命周期。(注:ITIL所提到的配置管理范围主要指的是CI的宽度和深度,CI的生命周期ITIL认为是从CI的接收到最终的报废退出,但在实施过程中,由于流程管理主体的差异化,对CI管理的生命周期的划分也有所不同。)
6.5.4.构建CMDB模型
有了CMDB建设保障之后,可以来梳理配置项信息及其关系,从而设计出CMDB模型蓝图,主要包括以下步骤:
定义配置项的关系
配置项(CI)之间关系的定义也是配置管理建设和IT资产管理建设的区别点之一。可以采取两种方法进行具体的梳理工作,一种是“自上而下”;另一种是“自下而上”。
“自上而下”方法一般要求企业已经明确了对外提供的服务目录,然后基于服务目录按照“业务服务——》IT服务——》IT系统——》IT组件”的顺序进行梳理。
顾名思义,“自下而上”方法是“自上而下”方法的逆向过程,企业先从对内部IT组件关系进行梳理的过程开始,然后逐步将IT组件映射到IT服务。相对来说,当前“自下而上”的方法适用范围更广。
定义配置项的属性
在构建CMDB的过程中,除了构建配置项(CI)关系外,还需要为每个配置项(CI)定义属性。
设计IT服务模型蓝图
最后,构建一份IT服务模型蓝图。蓝图主要起到了两个作用,一方面它是对当前企业CMDB建设工作成果的验证;另一方面,它也是对将来企业改进和完善CMDB建设方向的一种指引。通常蓝图中应该包括以下内容:判断CI的标准;定义CI属性、关系的准则 ;持续改进方案和过程;当前的IT服务模型等。
CMDB旨在存储与管理企业IT架构中设备的各种配置信息,有别于传统的数据库。CMDB作为统一的配置管理库,必须全面、细致而准确地记录和保存各种软硬件配置信息,以便支撑事件、问题、变更、发布等各种ITSM流程,成为整个 IT运维管理的基础。
/ 28
IT运维监管控一体化解决方案
6.5.5.避免CMDB建设误区
CMDB建设是一项“意义大、投入大、见效缓”的地基工程。需要明确系统定位和理清功能的前提下,应该确立并坚持以下原则:
应用场景决定管理粒度和幅度; 数据维护紧密结合ITSM流程; 自动采集作为数据核查手段; 专题应用带动数据维护;
配置项关系呈现直观化作为系统特色。
基于了上述原则,才能避免CMBD建设陷入数据“维护难 – 消费少 – 不准确 – 消费更少”的恶性循环,才能把项目带到了实用、有效阶段。
在CMDB建设和应用中,必须注意基础数据准确性的问题。如果用户保存了基础资源配置数据,但是存在较大的不规范、不全面的问题:设备的厂家、型号不规范,不符合系统要求;资源之间的关联关系缺乏,无法有效支持IT运维管理。
必须认识到,系统功能加上基础数据等于系统能力,系统能力加上频繁使用等于业务成效。如何保证数据质量,使系统成效发挥出来,避免功亏一篑,是CMDB建设中不可忽略的问题。
6.6.模块之间接口实现 6.6.1.监与管之间的接口
网管监控模块与流程管理模块之间的接口,主要体现为某些满足预定条件的告警自动触发生成电子工单,进入流程管理模块。
因此,如何实现监与管两个模块之间的接口、数据的转换和正确、准确和全面地确定触发条件,是设置此接口的关键之处。
如果未能正确设置触发条件,则会导致错误工单的产生,如工单类别错误。
如果未能准确设置触发条件,则会导致工单内容的不准确,如责任人或责任部门的错误。如果未能全面设置触发条件,则会导致漏派发工单。
工单中的信息与告警中包含的信息既有交集,又有转换和有所区别。工单的故障信息内容和描述来源于告警信息,但是告警信息应用于网管监控层面,是为了全面准确反映监控结
/ 28
IT运维监管控一体化解决方案
果,描述故障现象。工单信息是应用于流程管理平台,是为了描述故障、界定责任范围、规范工单流转、跟踪工单等目的。
6.6.2.管与控之间的接口
IT流程管理的最终目的和效果反映在对运维操作的指导上,而对于批量的、重复的运维工作,可以高效、优质和规范化地通过自动化运维操作来实现。借助于IT“监管控”一体化运维平台,其中的流程管理和自动化运维操作模块之间的接口,运维部门和人员可以预先设置过滤和触发条件,根据工单信息,关联个别的自动化运维操作脚本。
因此,如何实现监与管两个模块之间的接口、数据的转换和正确、准确和全面地确定触发条件,是设置此接口的关键之处。
如果未能正确设置触发条件,则会启动不必要的自动化运维操作,造成严重后果。如果未能准确设置触发条件,则会导致非预期的自动化运维操作。如果未能全面设置触发条件,则会导致遗漏预期的自动化运维操作。
6.7.报表系统
专业的IT运维报表可以准确、系统地反应IT信息系统运行状况和IT运维管理状况。对IT基础架构、业务系统运行走势和IT运维工作本身进行分析,反应目前整体现状,发现趋势和潜在问题,采用科学的手段完成评估,指导现在和未来的IT环境建设,促进后续工作的展开。包括:
事件类报表 告警类报表 问题报表 配置报表 工单类报表 „„
报表提供订阅的功能,对于用户订阅的报表,将定期自动生成html文件发送到用户邮箱中,方便用户查看。
用户也可根据需要选择将报表转换为pdf等其他格式。
/ 28
IT运维监管控一体化解决方案
7.IT运维一体化特点
7.1.监管控一体化整合
采用portal技术架构,克服了基础架构监控、运维服务管理和自动化操作运维的人为分割,实现集中管理、统一展示、统一配置、随需定制、分权使用。
7.2.层级化展现平台
以业务监控为中心,以事件为基础,将基础资源监控与业务服务贯穿在一起,建立从整体到局部、从宏观到细节的不同颗粒细度的层级化IT运维视图,以满足不同部门、不同级别领导和运维人员的关注层面和工作需求。
7.3.综合事件管理平台
各类基础架构的故障、性能、配置事件汇总并通过规则策略库和服务依赖模型,提供全面、及时、准确的、高效灵活的事件压缩、过滤、关联能力。
7.4.全方位IT资源管理平台
自动发现的IT资源数据库(RDB)与流程管理配置管理库(CMDB)的定期同步,实现资源管理数据的整个生命周期的管理。
7.5.面向基础设施
全面的系统资源管理:提供对网络、主机、存储设备、安全设备、数据库、中间件及应用软件、机房环境等IT资源的全面监控管理。
智能化的故障管理:自动收集、过滤、关联和分析各种管理功能产生的故障事件,实现对故障的快速定位和处理。
性能管理与优化:对网络和业务应用等IT资源的性能进行监控,定期提供性能报表和趋势报表,为IT环境性能优化提供科学依据。
7.6.面向维护管理者
运维服务管理:将人、技术与流程进行有效地融合,实现日常运维工作的自动化、信息化和标准化。
/ 28
IT运维监管控一体化解决方案
智能总控中心:实时展现当前企业IT系统的运行状态及趋势,帮助管理人员快速发现问题,分析和确定问题所在。
知识库:自动实现运维知识的积累、沉淀和共享,从而降低IT运维管理对个人的依赖。
7.7.面向领导决策者
综合报表:对系统运行状况的信息进行汇总,帮助领导更全面的了解网络系统的运行状况和趋势,为领导决策提供科学依据。
绩效评估依据解决:借助自动生成的各种工作记录,领导可对运维人员的绩效进行客观的评估
8.IT运维一体化系统功能
8.1.信息门户
IT运维一体化系统应该基于WEB实现,提供统一的portal信息门户平台,可以呈现各类发布信息,和各项IT运维工作的统一入口。同时提供个人工作室功能,不同用户可根据日常使用各项功能的频次自行定义工作桌面,为操作者迅速进入各项功能模块提供快捷手段。
个人桌面管理 待办事宜 已处理事宜 日程安排 工作计划及总结 个人收藏夹 任务管理 便笺管理 等
8.2.事故管理
事故管理负责记录、归类和安排专家处理事故并监督整个处理过程直至事故得到解决和终止。事故管理的目的是在尽可能最小地影响客户和用户业务的情况下使IT系统恢复到服务级别协议所定义的服务级别。
/ 28
IT运维监管控一体化解决方案
8.3.问题管理
当事件在第一时间没得到及时解决,就进入问题管理程序。
问题管理的重要性:通常80%的服务品质下降都是因为20%的问题,所以专注与20%的问题解决可以大大的提升服务。
问题管理的目标:将 IT 基础设施内的错误引起的事故和问题对业务的负面影响减到最小,并防止与这些错误相关的事故再度发生。为了实现这个目标,“故障管理”力求找到引发事故的根源,然后才着手改善或纠正该情况。
问题管理流程具有被动和主动两个方面:
被动方面是作为对一个或多个事故的反应而解决问题。问题分析方法: 定义问题;
按个体、地点、时间以及范围大小描述问题;
建立可能的原因;
测试最有可能发生的原因;
验证真正的原因。
主动“故障管理”是指通过趋势分析和定期的事件统计表,在事故发生前确定并解决问题和已知错误。
8.4.变更管理:
变更管理流程的目标:确保利用标准化的方法和规程有效、及时地处理所有变更,以便将由变更引起的事故对服务质量的影响减到最小或将事件数减少,并因此改进日常运维。
最常见的是终端用户提出的请求,其中有些是系统改进或增加功能的请求,有些是常规变更(如帮新进人员建立新的账号),有的可能是系统出错,这在IT 中通常称为事件,如果是系统出错就要找出原因和解决步骤,才能进入到变更管理的第一步:RFC提出变更请求,变更请求应该包括(RFC编号、问题编号、那些配置项需要改变、变更的理由、如果不变更会造成的影响、变更人的联系方式);变更管理员负责监督变更从提出到解决的整个过程记录进CMDB、对变更请求进行过滤;同时提交变更到公司指定的变更管理委员会批准。变更管理需要有准确的CMDB配置管理数据库,对变更进行分析。
/ 28
IT运维监管控一体化解决方案
8.5.发布管理
发布管理是指对经过测试后导入实际应用的新增或修改后的配置项进行分发和宣传的管理流程。发布管理以前又称为软件控制与分发,它由变更管理流程控制。
8.6.配置管理
在上边的变更管理中,我们提到当一个RFC进入变更程序的时,管理员和CAB需要有一个方法评估变更可能造成的影响,而评估需要的相关信息需要一个机制来提供,这个机制就是配置管理。
配置管理的目标是:
a.对公司内部的所有 IT 资产和配置及其服务作出说明
b.提供有关配置及其记录的准确信息以支持所有其他的“服务管理”流程 c.为“事故管理”、“故障管理”、“变更管理”和“发布管理”提供坚实的基础 d.对照基础设施验证配置记录并纠正任何异常情况
8.7.工单管理
提供电子化工作流程和工作人员的考核依据,实现运维工作管理的科学化、规范化和自动化。支持工单流程的自定义,方便配置成适合特定用户需求的流程管理平台。
基于工单的流程管理是流程管理模块的核心功能。工单管理有三个来源入口: 监视模块:网管监控系统发出告警,满足预先设置的过滤等条件触发产生工单,送转到流程管理系统。
领导派单; 服务台报单。
8.8.作业计划
作业计划模块主要实现针对各类运维作业计划工作的电子化管理,包括作业计划大纲管理、作业计划管理、月度作业计划、周作业计划、日作业计划等管理等模块。用户根据下发的作业计划大纲,进行作业计划模板定制和模板管理,再使用作业计划管理模块制定计划、月度计划、周计划和日计划。本功能模块主要包括如下功能:
大纲的制定、查询、修改 计划的建立、查询和审核
/ 28
IT运维监管控一体化解决方案
月度计划的建立、查询和审核 基于模板的作业计划制定 待执行作业计划提醒 作业计划执行情况考核 作业计划执行情况统计分析
8.9.值班管理
值班管理功能模块主要实现统一的机房电子化值班管理,将排班安排、值班日志、交班记录、维护作业记录,以及由各项维护规程和管理办法中确定的周期性维护作业计划等任务集成至该系统中,使得当班人员能够准确、高效地完成各项维护任务。值班管理具有以下功能:
电子化排班:排班任务制定后值班人员直接收到排班结果; 值班机房配置:支持对所有机房值班相关数据的灵活配置;
值班信息管理:故障巡查、线路巡检、网管巡查等值班数据信息的自动记录; 交接班管理:交接班人员通过本系统进行交接班,并自动记录交接班日志; 值班日志管理:对值班日志提供查询统计功能。
8.10.考核管理
结合用户的运维考核制度和考核办法,根据系统对日常运维工作的自动记录,考核模块能够实现对作业计划、工单调度、值班、代维等工作的考核管理功能。
8.11.代维管理
代维管理:针对行业特点和企业实际,增加代维管理。很多企业为了更让自己关注自己的核心业务并提高IT运维水平,而将自己的IT运维工作或者部分IT运维工作外包给更专业的第三方。因此,有必要规范外包方与承包方之间的关系和管理,包括工作内容、工作量的考核。
代维管理通过电子化平台实现与代维公司之间的联系,将代维公司的日常工作与用户的管理流程结合起来。由此实现对代维工作的规范化和高效的管理,同时建立代维公司的考核机制,实现优胜劣汰。
代维项目管理
/ 28
IT运维监管控一体化解决方案
代维合同管理
代维公司、代维队、代维人员管理 代维工作计划 代维记录 代维报告 代维问题跟踪 代维考核
8.12.知识管理
经验库管理:保存故障分析、问题分析经验或分析系统问题产生的原因等知识,为操作人员在解决各类问题时提供必要的经验或知识支持的专家经验系统。 资料管理:运用电子化手段对包括备品备件、各专业日常操作维护资料、运维人员资料、相关部门资料等信息进行添加、修改、删除、分类、归档、查看等操作。
8.13.安全管理
多用户、分级别、分权限设置 用户登录日志 用户操作日志
用户数量、登录位置、密码等安全限制
8.14.服务持续性管理
IT服务持续性管理是指确保发生灾难后有足够的技术、财务和管理资源来确保IT服务持续性的管理流程。IT服务持续性管理关注的焦点是在发生服务故障后仍然能够提供预定级别的IT服务,从而支持组织的业务持续运作的能力。
8.15.容量管理
容量管理的目的:确保以最有效和实时的方式提供目前以及未来因业务需求而增长的IT容量。
容量管理分三步走:收集与容量有关的技术信息、SLA、业务规划、IT计划、业务的需求以及数量大小,和财务规划与预算;
/ 28
IT运维监管控一体化解决方案
容量管理是大多数 IT 部门一直面临的一个挑战,因为基础设施和服务需求每天都在发生变化。如果没有财务限制,“容量管理”就会很简单。但是,实际上财务限制以及合理利用旧系统中的投资这种需求将继续使容量管理成为一个挑战。
8.16.可用性管理
可用性管理流程的目标:优化 IT 基础设施的容量、服务和支持的公司,以便提供成本效益且使企业满足其业务目标的可用性级别,在成本和可用性之间取得平衡。
可用性管理是通过分析用户和业务方的可用性需求并据以优化和设计IT基础架构的可用性,从而确保以合理的成本满足不断增长的可用性需求的管理流程。可用性管理是一个前瞻性的管理流程,它通过对业务和用户可用性需求的定位,使得IT服务的设计建立在真实需求的基础上,从而避免IT服务运作中采用过度可用性级别,节约IT服务运作成本。
9.总结
9.1.IT运维管理内容层面
依据管理内容对IT管理阶段大致分为:对基础架构的管理和对业务服务的管理。基础架构管理是IT管理的基础和底层数据的来源,也是管理的基本元素和根基。业务服务的管理是建立在基础架构管理的基础上,从业务的视角来衡量IT运维,是面向业务服务的IT运维管理。
以上述管理内容为主旨的IT运维管理系统,在管理思路和功能展现上,需要体现以下两方面内容:
以基础设施管理为根本
这一块内容是管理的前提和保证。没有好的基础设施管理作为保证,其它管理都会成为空中楼阁。在基础设施管理中,首先要保证管理的范围适当齐全,其次要保证管理的设备类型要完整,最后要保证管理的深度适当足够,以保证获取的底层数据要充分和有效。
以业务为中心管理思想
以业务为中心是IT全面运维管理解决方案最根本的因素。今天,IT环境仅有“可用性”是不够的,只有为业务提供最优性能才能使之立足。可用性、性能测量和管理都是当今运维管理的组成部分。性能测量应当融入全面IT运维管理解决方案并与之紧密配合,提供前瞻性预测和管理,而不仅仅是做事后诸葛亮。
/ 28
IT运维监管控一体化解决方案
9.2.IT运维一体化优势
企业的生产活动对IT环境的依赖性越来越强,IT环境规模不断扩大,架构异构度和复杂度不断增加,这些无疑对IT运维工作提出了更大的挑战。尽管存在这样或那样的风险和难度,但是IT“监管控”运维一体化仍然是不可逃避的趋势。
有了IT“监管控”运维一体化的综合运维平台,可以有效实现: 单点登录; 统一安全管理;
统一资源管理,整合一致的CMDB; 统一用户管理和角色管理; 统一展现模式;
通过模块之间的接口,借助于合理配置的正确和准确的触发条件,基于统一的CMDB核心,数据流转可以在模块之间自由完成ETL(抽取、转换和载入),真正实现IT运维工作一条龙的自动化;
在一体化平台内部,以前相互隔离的监控、流程、自动化运维平台演变为一体化平台内部的模块,既相互独立,又密切关联,相互衔接,业务逻辑上形成闭合环路,代表了IT运维工作的发展趋势;
/ 28
IT运维监管控一体化解决方案
同时,借助于IT“监管控”运维一体化,可以完善我们IT运维工作中的PDCA(Plan-Do-Check-Action)管理循环,达到良性的PDCA循环式阶梯上升过程。我们在IT流程管理模块中根据监视结果完成情报分析,提出计划和具体步骤(完成PDCA中的Plan阶段),在自动化操作模块中完成执行动作(完成PDCA中的Do阶段),在进一步的监视结果中,检查确认Do的效果(完成PDCA中的Check阶段),然后依据最新的监视结果进行调整(完成PDCA中的Adjust阶段),即制定新的计划(Plan),从而开始进入下一个PDCA循环。由此,达到运维质量的不断改进和提高(Improve)。