當前位置:首頁 >  科技 >  IT業(yè)界 >  正文

運維工程師小張的日記

 2021-02-25 16:53  來源: 互聯(lián)網   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

應公司市場部同學的邀請,我今天用日記的方式來向大家講述我工作中忙碌又普通的一天。

2020年12月X日,晴,某金融客戶變更日。

8:30 客戶變更室 巡檢

剛到門口,就看到部門的新人小浩已經在門口朝我揮手了。

“師傅,早呀!”

簡單向他交代幾句,我們就開始進行日常巡檢。巡檢的內容包括:從界面查看并處理告警、檢查集群是否健康、存儲池與硬盤的負載與時延、SSD緩存盤的負載和壽命等。

經歷過公司的專業(yè)培訓,這個過程對我來說并不復雜,但近20個集群,全部處理完也用了不少時間,當然還包括回答小浩同學的各種問題。

10點30分左右,開始溝通甲方和相關同事,確認當晚的變更事項,整理好變更單,申請堡壘機權限,為晚上的工作做好準備。

之后我開始處理郵件,操作手冊規(guī)定“所有變更類操作需要郵件報備部門領導與二線進行檢查確認”,而我的工作就是確保每個操作步驟都符合規(guī)定,不能出現(xiàn)紕漏。

12:30 餐廳 突發(fā)事件

全部處理完已經到了午休時間,和大家邊吃邊聊工作,順便提問檢查小浩上午的實踐學習情況,但其實他提的問題比我還多。

“張神,咱們負責的這個大客戶都用咱們什么產品呀?主要承載上層哪些業(yè)務…”

雖然不知道為什么我就變成了“張神”,不過給他講一講還是有必要的。

“咱們現(xiàn)在的工作就是保障客戶的存儲集群正常運行,發(fā)現(xiàn)并處理問題,優(yōu)化存儲性能??蛻裟壳笆褂昧宋覀兊腅BS塊存儲和EOS對象存儲兩種產品,有近20個集群,300多臺物理節(jié)點,上面承載很多金融業(yè)務,工作量不小,更需要打起精神。”

正聊著,我的手機突然響了,是其它項目的客戶。

“八成是來活兒了。”我邊說邊示意大家趕緊吃完。

果不其然,客戶的存儲集群出現(xiàn)了兩個壞盤,不影響使用,可語氣很焦急,希望盡快處理。

“不必擔心,XSKY存儲屬于軟件定義的分布式存儲,按集群架構,宕掉兩個節(jié)點也不會丟失數據。有備用盤,我們可以隨時更換。”

掛上電話,我轉頭對小浩說:“回去仔細看更換硬盤的文檔,下午帶你操作一次。”

15:00 辦公室 遠程服務

變更操作剛得到總部的確認,中午聯(lián)系的客戶已迫不及待地打來電話,新硬盤就位,現(xiàn)在就可以更換。

我再次和小浩確認了操作步驟:

1、定位故障硬盤在服務器上的槽位

2、拔出故障硬盤,插入新硬盤

3、圖形界面勾選新硬盤點擊【重建】

更換兩塊硬盤、遠端機房硬件工程師的聯(lián)動操作,20分鐘完成??蛻趔@訝于過程竟然如此簡單。

“是的,全過程業(yè)務無感知,就像打印機換墨盒,屬于常規(guī)操作…”

掛上電話,我開始交代小浩:“明天聯(lián)系一次客戶,更換硬盤后數據會做重平衡,確認重平衡完成、集群健康,任務才算完。”

小浩一邊點頭一邊做著記錄,“咱們的產品也太方便了吧,點點鼠標就搞定了!”

“研發(fā)的同事付出了很多努力。當然,咱們的反饋也很有用,對于產品優(yōu)化來說,咱們就是眼睛,要注意發(fā)現(xiàn)問題,溝通用戶、搜集信息并及時反饋,絕不只是解決完問題就完了。”

16:00 辦公室 整理文檔

小浩整理自己的工作筆記,我偷看了一眼,寫的很認真,不過他為什么在自己的本子上邊寫邊“涂鴉”?

算了,只要能記清楚,方式不重要。

公司是有知識庫和學習文檔的,但每個人的知識面和過程中的感悟是不同的,就像聽同一堂課,學生們的筆記也不盡相同,但只要勤于總結、積累,就能把它變成自己的經驗。

看完他,我也打開實施報告、工單忙了起來。

18:00 大廳 休息時間

晚上還有數據遷移的“硬仗”,我提議大家一會兒出去吃飯。

“張神,咱們忙了一天了,我是真不想走遠路了!”小浩說道。

另一個同事調侃:“小浩,現(xiàn)在不活動一下,晚上可要盯一夜呢,你見過坐久了,人銹在椅子上嗎?”

他說的沒錯,這是運維工作最難熬的部分,每周都有幾天加班到凌晨三、四點。運維的工作幾乎沒有什么高光時刻,我們要把“用心”放在每時每刻,確保用戶存儲的正常運行,重要但也平凡。

20:00 變更室 通宵

數據遷移開始了。

這是一場云管、計算、存儲、最終用戶四方聯(lián)動配合的重大變更,由云管協(xié)調,最終用戶遠端配合,計算端10個終端同時并發(fā)遷移腳本,存儲端時刻監(jiān)控后臺日志與遷移進度。

每遷移完一個應用,云管負責通知最終用戶進行驗證,如果存儲端發(fā)現(xiàn)問題,則要及時與計算端進行確認并迅速處理。緊繃的精神狀態(tài)一直持續(xù)近6個小時,直到凌晨2點多鐘,遷移腳本全部跑完了,用戶端業(yè)務全部驗證沒有問題,此時對于最終用戶、云管、計算來說,遷移已經結束了,但負責存儲的我們還不能離開。

因為此時數據還在后臺持續(xù)遷移,因為并發(fā)數比較高,有些卷還在遷移排隊等待中。我們要在數據全部遷移完成后對每一個卷進行校驗檢查,確保遷移過程沒有任何問題。

凌晨4點左右,完成全部工作。

我活動活動胳膊,起身拍拍小浩問:“困嗎?”

“剛才遷移過程,我超級緊張,一點都沒覺得困。” 小浩眼睛瞪得很大,不過眼白上已經有了不少血絲。

這就是我們的日常工作狀態(tài),沒事做才會困,當重要的責任落在自己肩上,就只會更加認真專注。

“下班了,回家。”

04:00(次日) 歸途

回家的路上不算太冷清,早餐鋪門口蒸包子的籠屜已經冒起白霧,送奶工、快遞員已經開始奔波,還有一輛灑水車緩緩開過。

這就是一個運維工程師的凌晨4點。

做運維很忙、很累,但同樣也有相當的收獲,接觸圈內最牛的專家、學習行業(yè)最新的技術、解決問題時成就感滿滿的“幸福一刻”,以及把知識與經驗傳承的使命感。

在XSKY技術服務部里,就有我的“引路人”,指導我從初出茅廬到獨當一面,現(xiàn)在我要在很多個“今天”中讓小浩也能快速成長起來。

每一次客戶的感謝、每一次技能的提升、每一次問題的解決,這就是我熱愛這份工作的原因。

這就是我的故事。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關標簽
工程師

相關文章

熱門排行

信息推薦