神行云兽服务,永不停歇的保障与响应

2018-10-08 14:16

国庆长假已经结束,我们又回归了正常的工作生活。

 

过节期间,除了各大景区的人山人海,朋友圈鄙视链也成为了一道亮丽的风景线。

 

自由行的觉得参加旅行团的只是走马观花,出国玩的觉得在国内旅游的都是土鳖一把,宅在家里的刷着景区人挤人的新闻呵呵一笑,在公司加班的却默默成了最大赢家。

 

神州光大在过节期间时刻守候在第一线,为客户排忧解难,保障与响应从未暂停,这不,各种紧急Case蜂拥而来……

 

十万火急的备件更换

正当人们沉静在即将放假的喜悦中,9月29日晚10点,某金融机构IDC机房HP DL580 G8设备告警,故障需求确认后, 客户希望次日早晨进行现场诊断并处理。根据客户提供的日志信息,初步判断为阵列卡故障,需要进行备件更换。

 

事发突然,又是晚上,发布工单一定会发生延误。收到需求后,平台工作人员第一时间在工程师资源平台进行工程师的筛选,对于符合地域、技能要求的工程师进行电话拜访,询问其是否能在第二天早晨到达客户现场。

 

时间一分一秒的过去了,因为假期临近,很多人都有出行计划,无法在指定时间到达,终于在第11次拨通电话,一名工程师可以按时上门,提供服务。

 

此时,已经是29日23:58,神州光大设备中心从最近的备件库调出了客户所需的阵列卡,进行打包发货。

 

次日,备件与工程师按时到达客户现场,凭借平台充分的事前准备和工程师娴熟的操作,阵列卡顺利更换,告警灯熄灭。

 

终于,可以松一口气了。

 

异常复杂的故障处理

十一期间,游客热火朝天的东北地区,设备也变得躁动不安。某运营商客户DELL MD 3600F 存储控制器更换,内存CATCH告警,而且背板故障,更换后有6块硬盘被锁。而硬盘中数据客户还不能接受丢失。因为问题复杂,几乎无人能搞定这个问题。

 

人员安排并不那么容易。

 

工单发出后,平台有工程师接单了,张工进行远程处理,判断硬盘上线需要DELL 二线资深专家通过底层命令,才能让硬盘里数据强制上线。

 

假日前夕,平台会提前与一些二线资深专家沟通,安排假日值班表,确保在假日期间依然提供二线支持,给客户做的底层恢复。有了资深专家的协助,顺利通过了第一环节......

 

10月2日,OSS所在服务器半天重启一次,张工一直远程处理。

 

10月3日,依然工作到24点以后。

 

10月4日,发现故障没有解决,临时搭建一台服务器,并将业务割接到LINUX系统,从而先保证业务不断,其他事后再修复。 

 

10月5日,OSS系统所在设备,一台IBM3650,其中有2个业务系统, 5日割接了一台,工作正常。

 

10月6日,配合客户割接第2个系统。业务恢复正常。

 

张工国庆节牺牲6天的时间来处理这些问题,计划好的旅行也放弃了。

 

在整个国庆期间,平台上的紧急救援Case多达几十个,每一单我们都跟平时一样倾注心力去做;每一单都仍然是站在客户的角度上,最大限度的为客户特别处理好由于假期所带来的各种不便。

 

神州光大就是这样一个平台,面对客户的需求,我们提供快速的响应和专业的服务交付,争做客户节假日期间的保护神。