發布時間:2021-01-21
2021年(nian)1月(yue)18日晚上(shang)8點22分,北方廣電網絡(luo)公司運行保(bao)障中(zhong)心(xin)IT支(zhi)撐組負責人楊健離開(kai)核(he)心(xin)機房后,終(zhong)于(yu)松了一口氣。當天,他在(zai)不依賴廠家技術人員指導的(de)情(qing)況(kuang)下,獨立排除硬(ying)件故障并成(cheng)功修復(fu)了損壞系(xi)統(tong),為公司節省15000余元(yuan)的(de)修復(fu)費(fei)用。說起這次系(xi)統(tong)故障,時(shi)間還(huan)要倒(dao)退到11個(ge)小時(shi)之前。
1月18日上午9點,北(bei)方廣電網(wang)(wang)絡公(gong)(gong)司(si)(si)運營支撐監控系統(tong)(tong)突然報(bao)警(jing),供應商(shang)(shang)管理(li)系統(tong)(tong)出現故障(zhang)。作為公(gong)(gong)司(si)(si)官方網(wang)(wang)站一級頁(ye)面的重要(yao)組成(cheng)內容,供應商(shang)(shang)系統(tong)(tong)停止工作會導致公(gong)(gong)司(si)(si)網(wang)(wang)站部分功能(neng)缺失(shi),影(ying)(ying)響公(gong)(gong)司(si)(si)采購項目信息的公(gong)(gong)告公(gong)(gong)示,使供應商(shang)(shang)無(wu)法(fa)按時(shi)(shi)上傳審核材料。如果不及時(shi)(shi)修復故障(zhang),會對公(gong)(gong)司(si)(si)品(pin)牌形象造成(cheng)嚴重的負面影(ying)(ying)響。
“從系(xi)統的(de)損壞程度判斷,已經(jing)不具備遠程服務(wu)的(de)條件(jian)。”楊健(jian)說,受(shou)新冠疫情及換修(xiu)硬(ying)件(jian)采(cai)購時(shi)間等因(yin)素影響,廠家提(ti)供有償上門(men)維修(xiu)服務(wu)至少要一天以后才能(neng)進行(xing)。此時(shi),面對(dui)緊迫的(de)搶修(xiu)任務(wu),他(ta)決定先(xian)自行(xing)開展維修(xiu)工作。
楊健(jian)根(gen)據(ju)(ju)(ju)多(duo)年(nian)的(de)(de)運維(wei)工(gong)(gong)作經驗判(pan)斷,故障(zhang)初步原(yuan)(yuan)因是(shi)硬(ying)(ying)件(jian)RAID板卡損(sun)壞(huai)(huai)。如果直接(jie)更換RAID板卡,需要(yao)聯系(xi)廠家進行購買,采(cai)購周(zhou)期(qi)時(shi)間(jian)長(chang),服務器內的(de)(de)數據(ju)(ju)(ju)也會有丟失(shi)的(de)(de)風險。為了盡快完成維(wei)修,確保數據(ju)(ju)(ju)安(an)全,首選(xuan)方(fang)案是(shi)修復RAID板卡。楊健(jian)先從其它(ta)備件(jian)中(zhong)(zhong)拆(chai)卸并更換了RAID板卡中(zhong)(zhong)損(sun)壞(huai)(huai)的(de)(de)原(yuan)(yuan)件(jian),將修復好的(de)(de)RAID板卡安(an)裝在其它(ta)測試服務器上運行,成功恢(hui)復了5塊硬(ying)(ying)盤(pan)(pan)的(de)(de)正(zheng)常陣(zhen)列(lie)信息。通過系(xi)統安(an)裝光(guang)盤(pan)(pan)引導計算機,訪問到硬(ying)(ying)盤(pan)(pan)陣(zhen)列(lie)中(zhong)(zhong)的(de)(de)原(yuan)(yuan)始(shi)數據(ju)(ju)(ju)。他深知數據(ju)(ju)(ju)的(de)(de)重要(yao)性,不(bu)能(neng)莽撞行事(shi)。為避免給公司(si)造(zao)成更大(da)的(de)(de)損(sun)失(shi),他用(yong)最原(yuan)(yuan)始(shi)的(de)(de)外部存儲(chu)方(fang)式(shi)備份數據(ju)(ju)(ju)。受單線(xian)程命令及(ji)外部存儲(chu)接(jie)口(kou)速率的(de)(de)限(xian)制,全部文件(jian)的(de)(de)分析及(ji)備份工(gong)(gong)作歷時(shi)6個多(duo)小時(shi)。
數據安(an)全了(le),懸著的心終于落地。但在隨后的檢查中楊(yang)健(jian)再次發現新問題(ti):服務器操作(zuo)系(xi)統文件損壞非常(chang)嚴重,已無(wu)法正常(chang)運行(xing)。“操作(zuo)系(xi)統核心數據損壞,最有效的方(fang)式(shi)就(jiu)是重新安(an)裝系(xi)統,但這需要廠商(shang)的配合才能(neng)(neng)完成。”而(er)此時并(bing)不具備這樣的條件,楊(yang)健(jian)只能(neng)(neng)在現場獨立修復(fu)受損的系(xi)統。系(xi)統文件相互調用,結構復(fu)雜,楊(yang)健(jian)只能(neng)(neng)在摸(mo)索中一點(dian)點(dian)進行(xing)。
歷時11個小時,當日晚上(shang)8點,楊健終于排(pai)除硬件(jian)故障(zhang)并成(cheng)功修復了損壞系統,供應商管理系統重新(xin)恢復運(yun)行。
打破廠商技術限制,自主完成設備優化
楊健2008年入(ru)(ru)職(zhi)于(yu)北方廣電網絡公(gong)司,先后就職(zhi)于(yu)運營支撐部(bu)、運行保障中心,長期從(cong)事硬(ying)件架構設(she)計、軟件開發部(bu)署、設(she)備運行維護(hu)等工(gong)作(zuo)。他責任心強,不懼(ju)困難,樂于(yu)專研(yan)。不滿足只做(zuo)好本職(zhi)工(gong)作(zuo)的(de)楊健,通過(guo)堅持不懈(xie)的(de)努力學習和(he)在(zai)技術一線的(de)工(gong)作(zuo)實(shi)踐,使他對運維工(gong)作(zuo)有了(le)更(geng)全面和(he)深(shen)入(ru)(ru)的(de)認識。
楊健工作照
對(dui)于運(yun)(yun)維(wei)(wei)工(gong)作(zuo)來說(shuo)(shuo),“穩(wen)(wen)”是工(gong)作(zuo)的核心,而(er)“變”意味(wei)著要打(da)破常規,突破規則,“穩(wen)(wen)”和“變”看似是對(dui)立矛(mao)(mao)盾。但在(zai)楊健看來,“穩(wen)(wen)”和“變”并(bing)不(bu)(bu)矛(mao)(mao)盾。隨著公(gong)司(si)5G業(ye)務的逐(zhu)步開展(zhan),對(dui)運(yun)(yun)維(wei)(wei)人員技術(shu)能力、管(guan)理水(shui)平等多(duo)方面都(dou)提出(chu)了更(geng)高(gao)的要求(qiu),如果運(yun)(yun)維(wei)(wei)工(gong)作(zuo)按(an)部(bu)就班,不(bu)(bu)以發(fa)展(zhan)趨(qu)勢而(er)創新,在(zai)技術(shu)上止步不(bu)(bu)前,習慣依賴于外(wai)部(bu)的技術(shu)支持,那么(me)我們(men)只能為(wei)(wei)此付出(chu)高(gao)額的“學費”。“公(gong)司(si)作(zuo)為(wei)(wei)創新技術(shu)型企業(ye),更(geng)需要穩(wen)(wen)中(zhong)應(ying)變,變中(zhong)求(qiu)進(jin),牢(lao)牢(lao)掌(zhang)握工(gong)作(zuo)的主動(dong)權。”楊健說(shuo)(shuo)。
幾年前,全省BOSS系(xi)統整合后遇到了(le)(le)性(xing)能(neng)瓶頸。如果按照廠(chang)商提供的(de)(de)(de)(de)技(ji)術(shu)改造方案,公(gong)司將付出高額的(de)(de)(de)(de)服務(wu)費用。為了(le)(le)打破廠(chang)商技(ji)術(shu)和(he)(he)(he)價格的(de)(de)(de)(de)壟斷(duan),經公(gong)司領導商議后決定自主進行升級改造。當時國(guo)內可供參考(kao)的(de)(de)(de)(de)技(ji)術(shu)資料(liao)(liao)非常有限,僅有兩三篇技(ji)術(shu)資料(liao)(liao)和(he)(he)(he)廠(chang)商提供的(de)(de)(de)(de)宣(xuan)傳技(ji)術(shu)概念。楊健(jian)根據豐富的(de)(de)(de)(de)知識儲備和(he)(he)(he)多年從事運(yun)維系(xi)統維護的(de)(de)(de)(de)經驗,悉心研(yan)究架構,最(zui)終達(da)到了(le)(le)既定優(you)化(hua)目的(de)(de)(de)(de),成功實施了(le)(le)BOSS系(xi)統的(de)(de)(de)(de)優(you)化(hua)和(he)(he)(he)割接。每(mei)年為公(gong)司節(jie)省系(xi)統服務(wu)費50余萬元(yuan),系(xi)統運(yun)行至今未購買維保服務(wu),間接節(jie)省運(yun)維成本200余萬元(yuan)。
北方廣(guang)電網(wang)絡公司(si)(si)多功能展(zhan)(zhan)廳是(shi)公司(si)(si)舉辦大型活(huo)動、對外展(zhan)(zhan)示公司(si)(si)前(qian)沿業務(wu)和產品的(de)重要(yao)場所。楊健深知保障多功能展(zhan)(zhan)廳各(ge)項設備平穩運行,即是(shi)工作任務(wu),也(ye)是(shi)政(zheng)治責任。
楊(yang)健(jian)接(jie)手展廳設備(bei)維(wei)護工作(zuo)時,距展廳建(jian)成已有4年的(de)時間,部分設備(bei)早(zao)以過了維(wei)保期,故(gu)障率較(jiao)高。在一次(ci)高規格接(jie)待(dai)任務前夕,展廳OTN網沙(sha)盤(pan)展示區播放控(kong)制端(duan)主機(ji)發生故(gu)障,送(song)修后(hou)被告知無法修復。楊(yang)健(jian)通過逆(ni)向分析控(kong)制端(duan)程序了解其運(yun)行機(ji)制,將其移植(zhi)到一臺筆記本電腦上,實現(xian)了控(kong)制功能。
還有一次,他在調試(shi)投影(ying)(ying)設備(bei)時發(fa)現5臺投影(ying)(ying)設備(bei)中有1臺投影(ying)(ying)發(fa)生故障,導致投影(ying)(ying)畫(hua)面不完整。這種高(gao)端投影(ying)(ying)設備(bei)單價高(gao)達(da)20萬元,沈陽當地沒有授權(quan)維修機構,只能(neng)送修北(bei)京。為確保第(di)二天的接待工作(zuo)順利進行(xing),楊健(jian)連夜(ye)加班,查找問題,最終修復了(le)設備(bei),圓(yuan)滿的完成(cheng)了(le)當次接待任務。
以上只(zhi)是(shi)他平凡工(gong)作中的縮影。楊(yang)健就是(shi)這(zhe)樣一位(wei)秉承工(gong)匠精神、嚴(yan)謹(jin)認真、精益求精、有(you)責任(ren)(ren)心、有(you)專業技(ji)能、肯(ken)鉆研(yan)的運(yun)保人。作為一名共(gong)產黨員,他時(shi)刻不忘發揮先鋒模范作用(yong)、任(ren)(ren)勞任(ren)(ren)怨(yuan),突破傳(chuan)統思維在其工(gong)作中做(zuo)出了卓(zhuo)越的貢獻。
(運行(xing)保障中心(xin))