自动化运维,让你远离背锅侠

BKJIA.com
综合报道】随着信息化建设的深入,IT管理已经提上了企业的重要议事日程,而以服务管理为核心的ITSM解决方案更成为众多厂商的首选,因为IT管理和业务管理的融合已经成为企业信息化建设的趋势,也成为IT部门转变的重要衡量标准。相对于单纯的网络管理,IT服务管理对IT运维厂商提出了更高的要求。

摘要

前言:IT监控运维系统,起源于各设备厂家的网元网管等监控工具,伴随着信息化的发展而升级换代,经历了大数据、虚拟化、云计算等技术革命的考验逐渐完善成熟。IT监控运维系统从最开始的解决故障,到提供高效的运维服务,已逐渐成为IT运维部门日常运维工作中必不可少的工具。

面对复杂的异构环境,如何及时全面地掌握网络、服务器、数据库、存储、安全等各类设备的运行情况?

摘要:大庆高新区人民法院信息化运维通过合理规划,全面部署了OneCenter
IT运维平台。通过业务管理功能,可以直观的查看业务系统与IT资源的关系,及时了解业务系统的告警状况及故障根源,快速定位问题原因,实现信息系统全网全要素指标数据的统一展示和管理,为运维决策提供数据支撑。

企业信息部门往往需要面对网络、服务器与业务应用、安全设备、客户端PC和机房基础环境,从基础环境到业务系统的复杂管理需求让IT管理人员面临着巨大的压力,如何举重若轻,实现对IT系统的集中、统一、全面的监控与管理。下面我们来看广通信达的ITSM解决方案架构,方案通过融入ITIL等运维管理理念,达到了技术、功能、服务三方面的完全整合,实现了IT
服务支持过程的标准化、流程化、规范化,极大地提高了故障应急处理能力,提升了信息部门的管理效率和服务水平。

山东省千佛山医院是省级大型综合性三级甲等医院,2015年经过政府招标选择了勤智OneCenter一体化智能运维管理系统作为医院的运维管理平台,负责全院的网络设备、安全设备、服务器、数据库、存储、虚拟化、HIS和LIS系统等IT基础资源的统一监控。2016年心内科综合楼启用,千佛山医院决定进行运维扩容;同时,为了有效监督管理第三方服务提供商,千佛山医院选择了勤智ITSM流程系统来规范和管理第三方服务商的运维服务。

随着企事业单位IT系统规模不断扩大,构成IT基础的设施呈现出规模庞大、结构复杂、品牌众多的特点,为实现信息资源合理配置、有效管理,确保系统安全可靠运行,IT集中监控系统的建设成为企业信息化运维工作的重点之一。同时,运维活动也缺少管控,如没有构建服务台、知识库、CMDB、事件管理等基本流程。此外,监控运维并不是简单的“监控+流程”,两者的有效结合也是一个难点。

面对越来越复杂的业务、越来越多样化的用户需求、不断扩展的IT应用,如何保障IT服务灵活便捷、安全稳定地运行?

法院行业特性

广通信达为用户定义了明确了运维层次,通过层次化的管理化繁为简,确保信息部门各司其职,总体围绕企业的IT系统运转而进行。ITSM解决方案从四方面对企业的运维管理进行定位:被管理对象层、基础数据管理层、统一事件处理层以及运行服务管理层。

行业特性

传统运维面临的问题

IT运维应运而生。

法院十三五信息化规划提出建设法院信息化3.0,内容总体目标是:建成以大数据管理平台为中心、以专有云和开放云为支撑、以五大网系为纽带、以二十三类应用为重点、以安全/运维和人才队伍为保障的人民法院信息化系统。运维保障作为法院信息化十三五规划三大保障体系之一,在信息化中发挥着越来越大的作用。

其中被管理对象层主要包括企业IT管理人员所关注的各类信息资源,包括网络、各类设备、服务器、操作系统、中间件、业务应用、安全设备、终端桌面、机房环境等基本实体。这些数据的管理直接关系到企业的网络环境的正常运行,因此从底层数据着手,体现了对IT服务的透彻管控。

千佛山医院目前由内网、互联网和无线网络支撑全院的业务系统,主要业务系统包括HIS、LIS、PACCS三大基础应用和依托三大基础应用的其他业务系统。监控范围主要包括覆盖全院的交换机、边界路由器、防火墙、入侵检测等安全设备、虚拟化、windows/linux等操作系统、sql/orcal等数据库。流程系统主要依托科室管理的事件、服务请求、问题等应用流程进行梳理。

错综复杂的IT元素难以有效监控

随着云计算、大数据、物联网、互联网+、IAAS的不断冲击,信息化部门也在考虑如何实现高效率的运维,将繁琐、重复工作简单化、自动化,DevOps自动化运维就显得尤为重要。

项目背景

其上一层次属于基础监测管理层,该层面主要包括实际完成各类被管对象的管理功能,从范围上主要包括网络设备、安全设备、服务器、应用平台、业务系统和终端桌面等,从功能看主要包括配置管理、拓扑管理、故障管理、性能管理等,基础监测管理层向相关领域的专业技术管理人员,通过技术人员的操作将实时反馈相应基础设备的数据反馈,而这些数据的成为ITSM解决方案中不可或缺的重要支撑,因为只有通过数据才能反映系统是否正常运行,实现提前告警的先决条件,也是对企业整体网络环境运行状态分析的重要指标。

医疗卫生系统监控运维的主要特点:

从宏观上看,IT设施种类各异,组成复杂,从最基础机房动力环境->基础网络->存储->X86(小型机平台)->系统->应用;从硬件到软件;从后台应用支撑服务到前台页面服务,这些错综复杂的IT元素很难有效整合监控。

DevOps故名思议就是Development和Operations的组合,是过程、方法和系统的统称,主要是为了把软件开发、技术运营和质量保证进行有效的结合,从运维到管理。

近年来,大庆高新区人民法院以“大数据、大格局、大服务”理念为指导,积极推进信息化建设,使法院信息化建设取得了突飞猛进的发展。法院信息化集成度越来越高,构成IT基础设施的信息化环境呈现大规模、业务系统结构复杂、设备多厂商的特征。网络资源主要包括网络设备、服务器、存储、中间件、数据库、应用系统,IT网络环境复杂化使网络维护难度呈几何倍数增长,IT信息科技方面的风险及隐患也在不断加大。

基础监测管理层收集到的数据经过归并分析整理,上传到统一事件管理层。顾名思义,事件管理层具备接入不同的基础监测系统的事件能力,强大分析引擎及事件规则库确保告警是准确可靠的,大大缩减了无关紧要的告警信息,从而让IT管理人员能更迅速定位真正故障的原因。在此基础上,通过事件管理提供的处理策略,完成真正告警的通知和自动化处理,由故障进而进行业务关联性分析,对企业重要业务系统的运转起到良好的保障作用。

1、IT基础设备数量庞大、种类繁杂,型号不一。随着医院信息化的建设,不同时期采购的软硬件资源不尽相同,因此造成了目前医疗系统复杂的IT运维环境。

从微观上细究,特定IT设施种类各异,品牌繁多。以存储为例,品牌涉及IBM、HP、EMC、Netapp
日立、华为、浪潮等,监控对象指标包含磁盘阵列的各个组件,指标包括风扇、电源、电池、控制器、硬盘的状态、实时性能,以及交换机的各温度、电池、主机映射关系等,获取这些指标并非易事。

运维,就是日常的运行维护,而DevOps是从制定计划到运营终止全生命周期的管理,那么DevOps自动化运维如何实现呢?

如何保证整个IT系统稳定安全的运行,逐渐成为大庆市高新区人民法院的管理层和工程师日益关注的问题。

最终由事件管理层上升到运行服务层,这也是信息部门最直观面对的IT管理层次,广通ITSM解决方案提供了集中的、全面的直观监控呈现,便于快速发现和分析各类运行隐患,从网络拓扑、业务视图、告警监测、资产视图、统计分析等方面为企业IT管理出谋划策,不仅实现了轻松运维,而且能提高IT服务质量,保障业务的稳定运行。相信业务的无间断运行是企业最愿意看到的局面,也是广通ITSM解决方案的宗旨所在。

2、运维工作繁重。综合性医院有着庞大的门诊科室和病房,信息化全覆盖决定了全院的挂号、就诊、化验、取药、住院、结算等业务都依赖信息化系统的稳定有效运行。但是信息科室的人员配备远远满足不了一线对IT服务的需求,传统的IT服务被动/繁杂且不易追溯和统计。

传统运维工具单一,无法集中管控

了解应用在全生命周期中每一个周期都需要什么样的工作、平台、组织、人员进行匹配支撑,如敏捷管理、持续性的交付、IT服务管理等。

综上所述,在IT的运维监控管理中,大庆市高新区人民法院提出了以IT运维管理平台为中心、以安全/运维和人才队伍为保障的人民法院信息化系统,行之有效的支撑法院业务的高效稳定的运行。

整套方案同时还提供了第三方集成接口,主要分为输入和输出两个部分,输入部分对应分布式数据采集接口,而输出部门帽对应系统数据交换接口,通过系统数据交换接口,企业可建立多层系统部署的数据交换和贯通,同时也能和其他第三方面系统进行良好的集成,确保企业IT投资的利用最大化。

3、缺乏有效、准确的运维数据统计。

企事业单位用户可以通过厂家提供的管理工具,如vmware
的VC客户端,存储的管理客户端,硬件服务器的web管理控制台,或者通过查看日志/硬件设备的指示灯等方式查看运行状态和性能指标。显然,这些零散的方式会增加运维工作量,影响故障发现的及时性,IT运维人员迫切需要一个统一集中的平台将以上监控任务有效整合。同时,由于缺少有效的流程管控机制,运维工作总是处于“救火式”状态。事前无准备,事中无跟踪,事后无法追溯,运维经验无法沉淀积累与复用。

持续性交付是核心,持续性交付的起点是应用需求的形成,重点是应用的高效运行,持续的优化、改进、审查、测试、部署、运营,形成PDCA闭环维度。

运维现状

整体来看,广通ITSM解决方案,为用户提供了从基础环境到业务系统的融合管理,保障了以业务为核心的IT系统得以持续稳定运行,从而有力助推了企业的信息化建设进程。

现状描述及需求分析

运维过程无流程或流程不成体系

传统运维面临的问题

在过去的IT运维管理中,由于没有一套先进的IT运维监控管理系统,使得业务系统的运维管理比较被动且滞后。当系统出现严重故障时才能发现该异常,导致故障处理速度较慢,有时甚至会影响业务系统的正常运行。所以,及时准确的了解设备性能、资源利用率、业务系统运行瓶颈等指标对于信息化建设有不可或缺的参考价值。

综合报道】随着信息化建设的深入,IT管理已经提上了企业的重要议事日程,而以服务管理为核心的ITSM解决方案更成为众多厂商的首…

现状描述

随着信息化及互联网+普及推广,企事业单位已经从大规模的信息化建设向信息化运维转变,运维团队不断扩大,信息化管理流程日益复杂,之前的纸制化审批流程效率低,难以适应新环境下的流程管理,需建立统一、规范、层次化的服务管理流程和服务管理体系。面对复杂的IT环境,缺乏规范化、自动化的运维处理流程,缺乏完善的故障处理和快速修复机制。

传统的IT运维是将数据中心中的网络设备、服务器、数据库、中间件、存储、虚拟化、硬件等资源进行统一监控,当资源出现告警时,运维人员通过工具或者基于经验进行排查,找出问题并加以解决。但是,随着互联网+时代的到来,移动互联网、云计算和大数据技术得到了广泛应用,从而导致企业所管理的IT架构不断扩大,服务器、虚拟化、存储设备的数量越来越多,网络也变得更加复杂,业务流程越来越繁琐,传统的运维管理也越来越力不从心。主要表现以下几个方面:

需求分析

医院信息中心领导班子逐渐意识到建设规范的IT运维服务管理体系的重要性,并且需要一套可支撑IT体系的运维服务管理系统对其进行固化和贯彻,旨在为医院业务提供有力的IT支撑和保障。同时,构建自动化运维管理能力,提供服务量化管理能力,从而能够切实提高医院的IT服务质量。

看OneCneter如何破局?

图片 1

根据大庆高新区人民法院信息化建设的现状及面临的问题,勤智运维分析并总结法院在信息化运维方面存在的以下需求:

需求分析

勤智运维磨砺多年,深刻理解IT运维“建设易,管理难”的特点和ITaaS背景下的服务转型阵痛,结合多年运维实践及对ITSS国家标准的制定与理解,推出OneCenter一体化智能运维管理平台,将“监控、管理、治理”三方面有机融合。

IT环境异构:系统软硬件种类繁多,导致运维人员运维监控压力大,日常工作量繁重。

 1、需要全局监控,快速定位故障根源,减轻运维压力;

1)信息化网络和IT软硬件资源可用性和性能的7*24小时自动监测,出现问题可第一时间发送告警消息,实现日常运维监测的自动化;按照管理职能分为网络管理员、服务器管理员。

OneCenter一体化智能运维管理平台可以让IT监控运维智能、高效、简单、统一,帮助运维团队实时、全面掌握IT运行态势,及时响应和处理IT故障,为各企事业单位业务提供强有力的IT支撑和质量保障。

故障发生后,运维工程师花费大量精力排查问题,无法快速和准确的定位问题,治标不治本。

 2、需要安全运维一体化,安全风险及时预警,避免事后救火;

2)通过系统提供的技术手段,实现对网络和IT软硬件资源可用性和性能的可视化趋势分析,从而实现对信息化容量的准确评估。

一体化IT设施监控体系

由于设备数量巨大,日常巡检占用大量时间,导致工作效率低下,事倍功半。

 3、需要丰富的业务视图与报表,展现IT建设成果,同时为IT未来投资决策提供数据支撑;

3)加强对信息化资产的管理,特别是分配给医院各科室的PC终端、打印机、自助终端、移动PDA和扫描枪等信息化资产,要建立资产档案,并对资产的全生命周期进行管理。

图片 2

工作机制混乱,面对庞大的IT系统,缺乏有效、自动化的运维流程,缺乏有效的绩效考核依据。

 4、需要可视化的网络架构拓扑图和静态3D机房视图。

4)参照ITIL和ITSS等国内外IT服务管理标准,并结合医院信息化运维现状,建立一系列医院运维服务管理保障流程,通过运维管理系统进行固化和应用,加强对服务外包工作的监督和管理。

勤智OneCenter的ITManager监控模块,可对业务系统及支撑业务系统的所有IT资源进行7*24小时全面监控,提供性能监控与分析、资源可用性监控与分析、资源拓扑关系管理、故障监控、故障分析及定位,帮助IT运维人员提升工作效率。

缺少自动运维机制:IT部门人员过少,导致运维压力大;由于误操作,导致无法挽回的灾难;大而全的系统,对运维人员技术能力要求越来越高。

图片 3

解决方案

开放式的一体化运维平台

系统内数据非常重要,如果遗漏备份,系统瘫痪/误操作等出现时会导致无法估量的后果。

图片 4

总体建设/规划思路

平台将机房环境、IT基础资源、应用系统情况进行统一展示、告警和管理,告别不同资源的离散管理模式。

自动化运维为你排忧解难

解决方案

考虑到千佛山医院的需求和运维现状,勤智推荐ITM和ITSM两款产品搭建统一运维平台,两台系统分别部署在两台服务器上。ITM监控系统规划了网络设备、服务器操作系统、数据库、URL、虚拟化、业务监控等功能模块。ITSM流程系统主要规划服务台、事件管理、服务请求管理、值班管理、资产管理、移动端运维等模块。

多维度可视化视角

自动化运维,可实现日常设备监控、主动发现问题、自动分析定位、基于标准化流程工具规范化处理、通过自动化运维操作工具处理修复等功能,最终实现监管治自动化运维。

规划思路

此外根据千佛山医院需求进行二次开发:

平台通过网络拓扑、业务系统、机房环境、虚拟化结构等多维度视角进行可视化展现,使资源全方位信息一目了然。

勤智运维深刻理解当前运维所面临的问题,根据多年来积累的经验,结合ITSS服务标准、DevOps、Iaas而推出的OneCenter系列产品,包含统一运维门户、多客户端移动运维、运维服务管理系统ITM、服务流程管理系统ITSM、运维自动化管理系统ITAM、运维大数据分析系统ITBA,为各行业信息化提供智能、高效、简单、自动化的IT运维管理解决方案,为企业业务提供强有力的IT支撑和质量保障。

勤智采用OneCenter一体化运维管理平台架构进行设计,实现对IT资源的监控及业务可视化的管理;基于单点登录的统一登录Portal界面以及统一的管理门户,全方位展现与业务相关联的所有设备和软件的应用状况和处理性能。

1.修改ITSM首页里的待办事项数据列,增加“工单签收状态”、“签收人”和“工单处理状态”三个数据列,方便跟踪工单处理情况。

基于业务级运维

图片 5

1、运维视图层:积累了对运维工程师最适用的各种运维管理视图,可帮助工程师全面、高效的实现日常运维管理。

2.为方便工单进度查询,在工单综合查询结果数据列中增加“工单当前处理人”字段。

支撑企业运营的是各个核心业务系统,所以IT组织的视角逐步从资源级运维向业务级运维转变,从业务角度出发,在可视化的业务视图上业务架构、服务和所依赖组件一目了然。

监控自动化

运维管理层:从业务服务保障的角度,对设备运行状态、数据库、中间件资源、机房资源进行监控和管理,并建立高效和快速的故障处理机制。

3.开发针对用户事件类型的报表统计。

更加聚焦故障管理

监控自动化是运维自动化的基础,通过自动化监控平台对各类IT资源(包括服务器、数据库、中间件、存储备份、网络、安全、机房、业务应用、操作系统、虚拟化等)进行实时监控,出现故障后进行告警归集并处理,解决同设备同指标同告警频报问题。当然,监控自动化的范畴很广,除了监控告警响应,系统也可从业务角度出发,根据业务系统运行情况,判断业务系统健康度。

2、被管对象:范围覆盖了从传统的硬件、软件到虚拟化、链路、机房等IT基础设施。

实施方案及部署成果

平台通过极简的界面和简单的操作结合系统强大的后台算法和分析能力,提供专业简单的智能化故障处理引擎。

图片 6

3、界面设计:OneCenter系统采用B/S架构,全中文的统一界面、菜单和报表,可以大大提高系统管理员的工作效率;界面展现内容可根据用户角色的实际需要自定义;系统内置的展现视图包括:资源统计、关注主机、关注网络、告警统计、运维服务管理仪表板等。

OneCenter一体化监控帮助千佛山医院实现全网IT资源的统一管理,目前覆盖网络设备和服务器300多台、近百个基础应用及业务系统。

自学习的运维知识库

数据采集自动化

4、分权分域:按照账户角色,实现资源分类、分级管理;对各种资源进行等分组管理,可以实现多人同时操作,互不影响,实现不同部门、不同权限只能查看属于自己管理的IT资源。

图片 7

帮助运维人员建立更加快速、高效地构建丰富的知识库,利用知识库快速对运维管理中发现的故障给出解决方案,恢复系统,确保业务正常运行。

数据自动化采集是保障运维人员实时了解系统运行状况的前提,系统支持单机DCS和分布式DCS部署方式,以应对不同规模网络架构;系统通过自定义采集策略,周期性采集,主动上报,通过DHS进行数据分析处理,并统一在系统上进行展示。

部署成果

拓扑视图

图片 8

图片 9

针对法院运维建设背景和需求,勤智提出一体化IT综合运维解决方案,从全局监控、安全运维一体化、业务管理、可视化四个层面提升法院IT综合运维能力,打造法院特色运维体系。

图片 10

一体化运维平台大数据分析能力

日常巡检自动化

1、可视化报表分析:提供丰富的可视化业务视图与数据报表,能满足用户不断变化的统计需求,系统可通过报表分析有序地展现网络运维的所有管理指标,生成各种分析报告和图表。

业务视图

ITBA运维大数据分析系统是大数据技术在IT运维领域的应用。该系统运维内部整合了Hadoop、Spark、Kafka、MongoDB、Solr、Flume等多种大数据架构技术,提供多种类型数据接口的采集方式,实现多平台/多业务的监控、流程等运维工具的数据整合和统一管理。同时,提供对于第三方业务平台的数据展现、数据统计、告警分析和业务分析功能,可以将多个系统在门户内进行统一登录展现;也可以与其他系统对接,从第三方系统登录至运维系统平台。一方面ITBA大数据作为统一运维监控的工具,可以采集各家数据,将非标准数据变为标准数据;另一方面可以提炼数据,进行检索,做海量日志分析。

运维日常巡检及定期备份是运维人员定期需要完成的工作,而这项日常操作耗时烦琐,针对这一问题,运维管理系统可代替人工完成,从而将繁琐的人工工作自动化,避免人为操作的疏漏,大大提高运维效率。

2、业务服务的可视化管理:快速建立业务系统的物理和逻辑架构的可视化视图;提供灵活的业务系统健康度、可用性算法,支持集群关系、主备关系、运行在关系(一票否决),支持权重计算,完全贴合业务系统实际业务情况;提供告警自定义,告警内容可以按照用户业务需求进行定义。

图片 11

图片 12

运维服务管理系统ITM通过系统配置,指定需要巡检的设备、接口及每天的巡检时间和次数,系统按照巡检模板定时巡检并生成巡检报表发送到指定邮箱,无需人工巡检填写巡检报告,让运维人员不论身处何地,也能定时了解系统日常运行情况,减少了工程师标准化、重复的工作,化人工操作为自动化过程,使工程师可以专注于其他更有价值工作。

3、拓扑视图可视化:自动发现局域网的真实设备和连接,生成局域网物理拓扑图,层次化的网络显示符合网络逻辑结构,并且关联设备的性能和告警信息,便于进行故障隔离和快速定位。

资源视图

丰富的监控模型库

图片 13

项目收益

图片 14

全面灵活的监控方式(SNMP、WMI、SSH、TELNET、SHELL、IPMI、HTTP、Agent、syslog、SMI-S
、JMX、GB/T28181、SDK、TCPDUMP等),使得系统具备全范围的监控能力。OneCenter一体化智能运维管理平台能够监控各种操作系统、服务器硬件、网络设备、各种WEB应用、数据库、中间件、存储、虚拟化、WEB站点等IT资源,还支持灵活的自定义脚本监控。

设备配置比对自动化

平台提供数据中心基础软硬件资源及各类应用的监控管理,包括网络设备、安全设备、服务器、数据库、中间件、业务应用系统等;主动及时地发现问题,解决被动服务的局面;提供集中的监控告警管理及监控性能数据展示。

虚拟化视图

图片 15

运维服务系统ITM内置标准化的脚本,通过脚本执行,定期下载备份系统配置及文件。系统通过日常备份配置文件比对分析,将变化内容高亮显示,让运维人员一目了然哪些配置被修改过;当配置发生变化后,会第一时间在告警台进行展示。当设备不可用时,通过快速恢复功能一键恢复。

案例亮点

通过OneCenter监控系统的自动巡检功能,千佛山医院节省了大量的人力资源,并且保证巡检数据的真实性和可追溯。

告警集中展现

图片 16

1、从业务角度管理IT资源,对业务的运行状态进行监控。

图片 17

OneCenter
一体化智能运维管理平台提供统一的告警管理,通过性能指标采集轮询、调用厂家网管告警接口、网元Trap/Syslog主动推送、第三方系统轮询获取等多样化的来源方式,获得整个网络系统中各种事件、设备故障、网络异常等告警信息。当出现故障后,OneCenter一体化智能运维管理平台能通过预置的报警方式,以邮件、短信、电话自动拨打等“告警必达”方式及时通知指定用户,并能生成告警分析统计报告,提供主动式的故障解决方案。

图片 18

2、提供业务级报告,对业务系统及其组件的整体运行状态生成报表,对业务系统进行分析。

图片 19

图片 20

故障定位自动化

3、内网网络架构展示真实准确的网络拓扑图,实时展现IT资源的运行状态和运行信息。

巡检报告

图片 21

运维服务管理系统ITM提供了一套智能化的故障排查处理机制,立足提高工程师处理效率,灵活的故障策略能适应各种各样的IT变化,帮助工程师在海量的告警中,准确的定位故障、通过自动抓取设备快照,了解当时系统运行情况,快速定位故障,有效缩短排障时间,解决运维难题。

4、静态3D机房展示出IT设备所存在的物理位置,准确定位告警设备的位置。

通过OneCenter的流程系统,可实现系统故障、优化建议、任务派发的快速可视化执行,并可做到分权分域,各级组织可独立运转,也可通过一定的路径进行升级处理,灵活高效;实现对外包服务商清晰有效的管理。

统一的运维管理平台,规范日常处理流程

图片 22

图片 23

OneCenter 一体化智能运维管理平台
基于ITIL标准形成了一套结合服务台、知识库、CMDB、事件管理、问题管理等流程的统一运维管理平台,可以和监控系统做无缝衔接,日常告警事件可直接触发工单运维,提高工作效率。OneCenter系统采用多层架构及模块化的设计,系统功能全面,模块功能独立,可根据不同需求自由组合。同时,OneCenter
一体化智能运维管理平台具备良好的扩展性,通过第三方数据接口和数据总线以及门户Portal,与第三方产品可进行无缝集成。

数据分析自动化

服务台

图片 24

大数据时代,如何从海量的数据中提取有价值的数据,也是当今最热门的话题。大数据分析平台ITBA,通过针对ITM系统所监控的资源设备性能数据和其他业务系统运行日志进行分析,掌握当前业务系统运行情况,了解性能、容量瓶颈问题,根据日常的运行情况及性能信息指标,综合进行预测,防患于未然。

图片 25

另外,OneCenter
移动终端运维管理,提供移动服务台、告警列表、工单待办列表、工单查询及处理操作、设备巡检、系统公告接收和知识查询等功能,为运维工程师提供了一种便捷的运维模式,有效提高IT部门整体运维能力。

图片 26

科室管理

图片 27

流程处理自动化

图片 28

IT监控运维系统已逐渐成为IT运维部门日常运维工作中必不可少的工具,并在很多已建成的运维项目中发挥着不可替代的作用。如国家核电统一运维项目,实现了统一监控、统一运维、统一展现等“七个统一”;湖北省公安厅智能IT统一管理平台项目,实现全网上千种IT资源的统一管理和IT资源故障告警自动流转进入服务流程;湘潭大学一体化运维项目,支持复杂环境的大规模监控,有效提升IT运维管理和服务能力。

服务流程系统ITSM遵循ITIL标准,建设标准化、规范化的运维服务管理体系。运维服务管理平台的建设遵循ITIL管理思想,通过流程与资产的无缝对接,建立资源运维规范化流程;通过流程化运维方式,让每一次运维都有相应的记录,可随时查看运维历史及运维记录,包括排障记录、变更记录、服务记录等,并且提供表单自定义和流程自定义功能,实现客户运维管理标准化、规范化。在工单处理完后,一键转化为知识库,提高工作效率。

工单管理

图片 29

图片 30

故障处理自动化

工单自定义报表统计

大批量的系统每天会产生海量的告警,很多告警都属于常规性告警,如磁盘空间不足,CPU、内存利用率过高等问题。这些常规性运维,工程师需要逐一去进行派单、恢复处理,但是面对成千上百的设备,工程师往往会力不从心。

信息中心主任介绍说:“运维项目的成功实施,帮助医院建立起了较完善的运维管理体系,使医院的信息化运维工作变得主动、规范而有序,运维人员的工作积极性和客户满意度明显提高。”

勤智服务流程管理系统ITSM可进行策略配置,当产生告警后,根据预先配置的策略,自动生成工单,不同的告警进行不同的工单、派单处理,有效地将服务台和服务请求、事件问题、标准变更发布流程整合,使运维服务过程有统一的任务优先级排序、跟踪和评估
/ 审批,运维人员只需要根据工单进行处理即可。

案例亮点

图片 31

凭借在运维管理领域多年积累的行业经验和过硬的软件产品,勤智为此项目提供了前期的运维管理体系咨询服务和软件产品实施服务,得到了千佛山医院的充分认可。

日常操作自动化

  • 勤智派出医疗行业咨询专家与千佛山医院一起进行项目建设目标定义、差距分析、运维管理体系建立等方面的前期规划,为整个项目后续的成功落地起到了关键作用。

  • ITmanager服务运营支撑平台将医院所有IT基础设施全面监控起来,通过网络拓扑图、设备性能视图、机房视图、设备告警视图和业务系统视图直观反映全网IT资产和业务系统的运行状态,及时发现设备故障,变被动运维为主动运维。

  • ITSM流程系统建立适合医院运维工作需要的服务请求、事件、问题、变更/发布等闭环服务流程,提高整体运维工作效率。通过SLA、OLA等服务级别协议的设定,为IT部门和第三方服务商的服务质量考核提供数据基础。通过ITSM内置的知识库功能,建立医院运维知识库,提高运维工作效率和减少因运维人员流动造成的知识流失。通过ITSM内置的CMS资产管理系统,建立医院IT资产和备品备件管理系统,全面了解资产、资产变更和备品备件使用情况。

  • 移动APP广泛应用。运维人员在遍布全院的无线环境下通过移动运维APP完成接单、处理工单、现场支持,提高了运维效率。

  • 统一运营门户将服务运营支撑和服务流程两个系统进行了深度整合,提供贴近用户自身职责的管理视图,方便用户更加人性化的管理IT服务。

日常备份自动化

图片 32

在运维过程中,除了日常巡检,另外一个比较耗时的工作就是日常备份。在系统运行过程中,可能会出现一些不可抗拒的因素,比如地震、断电等导致设备损坏,或者人为的误操作导致系统不可用等,为了保证出现问题后快速恢复、确保数据完整和有效性,定期的备份就显得尤为重要。

推荐阅读

运维自动化平台ITAM系统内置WMI、Telnet、Ssh、Http等工具,通过编写Shell、Python、Bat脚本,通过可视化流程编排设计器,将运维操作和被管资源相结合,通过定时批量备份数据,减少人工工作量。

【案例】大庆炼化公司运维管理平台

图片 33

如何做好服务流程

系统优化自动化

【案例】湖北省公安厅智能IT统一管理平台

针对常规问题,如一些服务器本身负载较大,占用大量的资源导致系统长时间运行后非常缓慢,为了保障系统的正常运行,运维人员每天要做大量的重复工作导致工作效率极低,而且有时候由于自己的操作失误,导致关键数据丢失,带来不可估量的后果。自动化运维系统ITAM,通过内置Shell、Python、Bat脚本,以定时或者人工触发的方式,实现定时优化系统、故障自动化处理、批量配置系统、关键服务启停功能,构建企业自动化运维、从而提到运维效率,降低操作风险。

图片 34

图片 35

阅读原文:

大批量配置自动化

运维人员在日常工作中,需要针对设备进行常规性配置,如创建用户、增加磁盘空间、安装程序补丁包等重复性工作。面对数以千计的设备,传统运维方式下,工程师需要逐个登陆系统进行配置,不但效率低下而且极容易出错。

勤智自动化运维平台ITAM通过编写脚本,关联被管设备,定时批量执行,可大大提高运维效率,保障了执行的准确性。

图片 36

系统详细记录每台设备的作业执行操作过程,用户可通过WEB端动态查看作业执行过程、执行日志,以及执行结果等信息,让一切运维操作均有据可依、可查、可跟踪。

图片 37

自动化运维场景化

OneCenter自动化运维是将运维服务系统、服务流程系统、大数据分析平台、自动化管理系统进行有效结合,全面对数据中心资源设备进行监控,产生故障后自动派单进入ITSM系统进行故障处理,规范运维流程工作,再由ITBA对监控性能数据进行分析预判,掌握系统负载及性能数据,预测未来系统运行态势。根据预测结果,编写Shell、Python、Bat脚本。

通过定期执行脚本,优化系统性能、保障系统运行。

通过流程节点触发,自动处理问题,彻底解放人工工作量。

批量修改配置及增加配置信息,提高工作效率。

总结:

自动化运维是一个大命题,随着互联网+、大数据、服务器虚拟化等技术的发展,网络设备与服务器的运维管理正在发生很大的变化。通过这几年对ITIL的实践,各行业都有了很多的经验。相信随着时间的推移和互联网化的发展,会有越来越多的企业在自动化运维方面有所创新。勤智运维也将结合最新的IT架构、虚拟化等技术,帮助用户一起实现更高效的自动化运维。

网站地图xml地图