国津.鸿运维-十年专注一个领域!IT运维管理软件,ITIL管理系统,运维管理系统,运维软件

【国津ITSM助力太钢提升信息化管理和IT安全】

   2015年10月开始,加上后续的系统优化服务、前后历时近一年,国津团队以自主研发、积累多年实施经验的Ahoova·ITSM产品、委派多位同事组建临时项目小组、配合上下游伙伴产品的提供商、一起参与并且完成了太钢ITSM项目的实施, 参与的同事有北京的Faith Yang、珠海的Martin Jiang、Yvan Zhou、太原的Jax Liu,还有许许多多后台做Customizing二次开发、远程支持的同事们;除了常规的项目实施工作之外,特别值得一提的是, 国津软件不计成本、于2015年10月19日那一周、以及2016年6月12日开始的两周、委派软件工程师Martin和Yvan在太钢客户现场一边与客户沟通项目定制需求、一边完成了ITSM重点定制功能的二次开发,得到客户和业务伙伴们的一致好评。
 


【图解】Martin(江工)和Yvan(周工)在太钢现场的项目实施记录

以下是太钢项目的简要总结:

1.客户背景、项目之前的需求背景


   太原钢铁(集团)有限公司(简称太钢)是中国特大型钢铁联合企业和全球产能最大、工艺技术装备最先进的不锈钢企业。太钢的主要产品有不锈钢、冷轧硅钢片(卷)、碳钢热轧卷板、火车轮轴钢、合金模具钢、军工钢等。不锈钢、不锈复合板、电磁纯铁、火车轮轴钢、花纹板、焊瓶钢的市场占有率国内第一;
   太钢信息与自动化技术有限公司负责太钢所有信息化系统的运行维护及管理工作,包括MES系统、计质量系统、ERP系统、一卡通系统、物流管理系统、门禁系统、OA系统、邮箱系统、网络系统等;涉及400余台主机、1500余台交换机、100余套数据库、43余台核心和非核心存储; 除了人员和技术因素之外,这么多的配置项(各类软件硬件以及网络)如何在流程管理方面、监控管理方面保证系统安全性?ITSM系统的引入于是应运而生!
   项目开始之前,信息化服务台的工作缺少有力ITSM工具的支持,在运维中只能充当被动“救火员”角色,哪里有故障就处理哪里;且面对复杂的系统故障,很难对故障点进行准确定位,能做的工作有限且成长空间很小,使得首次故障派发耗时过长,导致首次故障解决率和首次故障派发成功率较低;
   上述设备上运行着太钢重要的信息化系统,存储太钢生产经营管理的重要数据,需要一套适合太钢信息化规模和水平的集中的自动化运维监控系统与运维服务管理平台(ITSM)来保障各系统和设备的稳定运行。
系统采用高度模块化设计。所有提供的模块保证满足太钢集团网络、主机、应用等的综合监控、运维服务管理(ITSM)、故障报警及处理、报告以及其他要求。
 
【图解】项目实施过程的总体阶段划分

2.太钢集团ITSM项目要求

项目整体要求

   基于 ITIL 标准,完成覆盖集团各级相关单位的集中、统一的信息管理系统的开发和建设工作,实现各种信息系统运行维护管理工作标准化管理。要求实现IT运维服务分级管理,各单位自上而下统一执行集团信息相关工作制度和流程;要求实现数据一次录入多处使用,各业务模块紧密关联,保证数据的一致性、准确性。建立规范的数据库,提供综合查询功能,并可生成分类统计报表。
IT运维服务管理系统提供如下功能:用户自助服务平台、事件管理、问题管理、变更管理、发布管理、配置管理、服务级别管理、知识库。
组织机构管理要求
   支持多级组织部门的设置,在组织机构中需要配置的信息有:机构类型、机构等级、机构状态、人员类型、人员状态、职位等级、职位类型、职位状态。
角色权限管理要求
   要求角色定义灵活,权限管理可以到每个功能,每个人员根据角色和所属机构只能看到所管辖的机构数据。
(1)分公司业务员只能看到自己提交的服务请求,分公司IT人员(一线)能看到和处理所属分公司的服务请求,不能查看和处理其它分公司的服务请求;
(2)市县子公司业务员只能看到自己提交的服务请求,子公司IT人员(二线)能看到和处理所属子公司及本子公司下属的分公司服务请求;
(3)专业子公司业务员只能看到自己提交的服务请求;

(4)股份公司IT人员可以看到和处理股份公司职能部门、专业子公司及所有市县子公司、分公司服务请求;
用户自助服务台
   通过用户自助服务平台,为用户提供IT 服务窗口,用户可以通过该窗口,自助上报事件或填写故障申诉和服务申请记录,并支持快速报障方式与通道,上报流程简单,模板化。提供知识库关键字查询,方便用户自助解决问题。同时最终用户可自助服务平台提交请求、跟踪请求处理进度,并可对请求的服务质量进行评价。
   用户可通过自助服务台查看通知公告。

3.国津软件做的项目实施的主要任务
  1、提供基于ITIL最佳实践的运维服务管理流程:具有服务台功能,支持统一的服务、事件入口,服务台负责受理、调派、维护、跟踪、反馈,所有事件通过服务台进行流程运转;实现事件管理、问题管理、变更/发布管理、值班管理等流程功能,并且可以进行灵活的修改配置;具有知识库功能。
  2、建设配置管理数据库(CMDB)功能,提供IT环境中各类资源的配置模型,可以维护每个配置项的详细数据、变更版本。提供可自动生成的配置关系图,支持人工维护修改。
  3、建设资产与配置管理功能,包括各类IT资源进行管理,为各类IT资源建立资产档案库,IT资产管理功能包括从资产登记、资产变更、资产维修、资产调拨、资产维护、资产报废的整个过程。
  4、提供各类资产的模板(如服务器、网络设备、各类软件、数据库等),供用户进行数据的收集,进而导入到系统中。

4.实施后效果提升前后对比

客户原有情况

实施后为客户带来了运维管理的提升和进步

1.IT规模越来越大,IT管理越来越复杂

优化了现有运维管理的组织结构。建立扁平化的运维组织结构;生产中心的高度集中化,明确其生产职能;建立面向服务和客户的运维支撑体系。

2.IT运维人员的工作绩效难以考核。

建立面向用户的考核体系。弱化反映设备运行完好率及设备运行效率的指标;强化反映网络运行品质和服务水平,即衡量客户满意度的总体指标;突出反映重点区域、重点业务、重点客户差异化的动态专项指标;关注反映与竞争伙伴之间质量差异的指标。

3.简单重复性问题比例较高,忙于救火。

建设运维管理团队。维系跨专业核心专家队伍的相对稳定;建立技术维护人员动态管理机制;充实一线维护,合理组织梯队化的人才队伍;构建知识型网络运维体系。

4.考核没有 “抓手”,IT运维服务部门价值难体现。得不到业务部门的认可和尊重,难于真正调动团队积极性。业务对IT越来越依赖,而IT投资回报无法量化。

理顺运维与其它部门间的关系。理顺面向客户的重要流程;理顺通往客户的沟通渠道;建立持续改进的工作机制。

5.面对多个供应商,缺乏管理框架进行服务集成。缺少面向运维工作的平台工具,日常工作停留在手工或半手工状态,行业先进的运维管理理念未能充分应用到实际工作中来。

做好运维外包中的合作管理。坚持核心业务自主维护;保障网络质量的基础上统一服务标准、规范外包服务,建立长期合作;整合资源,提高效率,实现了跨专业综合运维。


【附录:太钢IT运维服务管理平台建设准备.现场访谈纪要-安全生产科】

注:从以下这些 2015.10.21 的现场调查的部分结果就能看出,当时太钢缺乏 IT 运维服务管理平台系统、而且管理也不太规范的情况。例如:
1.服务请求用“纸质的委托单”、服务处理没有记录可以跟踪;
2.虽然公司信息系统根据重要性划分为 A、B、C 级,但是没有明确地定义事件的等级划分标准;所以也没有相应等级的服务水平标准(例如响应时间和完成时间的规定);
3.手动汇总统计提交上来的服务请求和事件作为日报、月报,是一个 word 文件(没有相关的软件系统自动生成这些报表、所以报表的及时性和准确性不能保障)。
4.没有专门的知识库。
  

访谈时间

2015.10.21 ,

9:00-12:00

访 谈 地点

二楼会议室

访谈部门

安全生产科调度室

访谈对象

方先生

职务

生产运行管理

联系方式

 

提问人

李先生、申先生

 

记录人

申先生

  

   问题 1

请简要介绍所在科室的职能?

    记录

负责生产运行组织及调度管理工作,本科室各岗位职责描述详见《安全生产科的岗位职责描述.xls》

    备注

山西太钢信息与自动化技术有限公司(以下简称“信自公司”)

《山西太钢不锈钢股份有限公司生产事故管理办法》

《太钢不锈自动化公司生产调度运行管理办法》(2012.6)

《太原钢铁(集团)有限公司信息系统安全管理办法》(2015)

   问题 2

自动化公司面临的服务请求有哪些受理渠道?服务请求是怎么处理的?本科室面对的服务请求有哪些?

    记录

1、 自动化公司通过“信息化服务台”和“电话故障台”这两个渠道正式受理服务请求,但是也存在客户直接联系服务人员直接完成服务请求的情况(例如分厂直接联系负责本片区的网络管理员修复本厂的网络故障,该事件处理过程在服务台中没有留下相关记录)的情况。此外,会通过纸质的委托单或在 OA 流程中提交服务请求。

     通常情况下,对于厂内 IT 业务和信息化方面的服务请求,客户是提交到信息服务台,由信息管理科负责组织信息网络室、MES 研发室、ERP 研发室进行处理,次日将统计信息发送调度室;对于通信、话务、计量、自动化控制方面的服务请求,客户是提交到电话故障台,由安全生产科调度台分派到通信作业区、话务作业区以及其它作业区进行处理。

2、 安全生产科调度室对接收到的服务请求,统一按照四大专业类别进行处理,分别是信息化、自动化、通信、计量。通常,信息化服务请求由信息化服务台处理,自动化/通信和计量的服务请求由安全生产科调度室受理后转派到相关专业区进行。

3、 安全生产科主要处理来自电话故障台的服务请求,也包括从信息化服务台(信息管理科需要外部协调)流转过来的服务请求。安全生产科负责自动化公司对外的协调和调度。

    备注

 

   问题 3

自动化公司的运维事件分类、分级标准是怎样的?相应的响应时间要求是怎样的?

    记录

1、 根据《太钢不锈自动化公司生产调度运行管理办法》(2012.6),故障划分为 4 级:重大设备故障、一般设备故障、故障、小故障,并定义了判定标准(根据设备故障时间、损失、影响范围定级),该级别来自装备部的定义。文中也提到重大通信光、电缆故障,属于重大故障级别。

2、 根据《太原钢铁(集团)有限公司信息系统安全管理办法》(2015)第七条,公司信息系统根据重要性划分为 A、B、C 级。没有明确地定义事件的等级划分标准。所以也没有相应等级的服务水平标准(例如响应时间和完成时间的规定);

3、 公司制度里对于事件的处罚也有规定。        

   问题 4

请举例说明事件的响应处理流程?

    记录

    以计量事件为例,安全生产科负责集中受理,一线支持为计量作业区,由组长安排合适的技术人员进行处理。如果无法处理或需要其它协助,则根据事件的具体性质,安全生产科安排二线支持(包括维护作业区、自控研发室、信息网络室等)。

   问题 5

服务台的管理现状是怎样的?

    记录

    电话故障台由安全生产科负责管理(信息化服务台由信息管理科负责管理)。调度室编制 5 个人,四班倒,每天早上 7 点会手动汇总统计提交上来的服务请求和事件作为日报,是一个 word 文件(没有相关的软件系统自动生成这些报表)。每月的月度分析会上,会对事件情况、事件发展趋势以及总结分析等进行说明,并记录在会议纪要里。没有专门的知识库。

    备注

 



>>返回

国津软件-十年只做一个产品!IT运维管理软件,IT服务管理软件,ITSM/BSM系统,ITIL!