服務(wù)器運(yùn)維 | 游戲公司的自動(dòng)化運(yùn)維體系建設(shè)
2020-05-29 17:01 作者:艾銻無(wú)限 瀏覽量:
艾銻無(wú)限是一家專門做企業(yè)
網(wǎng)管外包服務(wù)的機(jī)構(gòu),通過(guò)線上+線下結(jié)合的服務(wù)方式,為企業(yè)提供
電腦維修、辦公設(shè)備維護(hù)、系統(tǒng)維護(hù)、網(wǎng)絡(luò)與數(shù)據(jù)安全、服務(wù)器運(yùn)維等專業(yè)的網(wǎng)管服務(wù)外包公司
在很多初創(chuàng)公司和中小型企業(yè)里,
服務(wù)器運(yùn)維還停留在“刀耕火種”的原始狀態(tài),這里所說(shuō)的“刀”和“火”就是
服務(wù)器運(yùn)維人員的遠(yuǎn)程客戶端,例如SecureCRT和Windows遠(yuǎn)程桌面。在這種工作方式下,服務(wù)器的安裝、初始化,軟件部署、服務(wù)發(fā)布和監(jiān)控都是通過(guò)手動(dòng)方式來(lái)完成的,需要
服務(wù)器運(yùn)維人員登錄到服務(wù)器上,一臺(tái)一臺(tái)去管理和維護(hù)。這種非并發(fā)的線性工作方式是制約效率的最大障礙。同時(shí),因?yàn)槭謩?dòng)的操作方式過(guò)于依賴
服務(wù)器運(yùn)維人員的執(zhí)行順序和操作步驟,稍有不慎即可能導(dǎo)致服務(wù)器配置不一致,也就是同一組服務(wù)器的配置上出現(xiàn)差異。有時(shí)候,這種差異是很難直接檢查出來(lái)的,例如在一個(gè)負(fù)載均衡組里面?zhèn)€別服務(wù)器的異常就很難發(fā)現(xiàn)。隨著業(yè)務(wù)的發(fā)展,服務(wù)器數(shù)量越來(lái)越多,
服務(wù)器運(yùn)維人員開(kāi)始轉(zhuǎn)向使用腳本和批量管理工具。腳本和批量管理工具與“刀耕火種”的工作方式相比,確實(shí)提升了效率和工程質(zhì)量。但這個(gè)方式仍然有很多問(wèn)題。第一是腳本的非標(biāo)準(zhǔn)化的問(wèn)題。不同的
服務(wù)器運(yùn)維人員寫的腳本在所用的編程語(yǔ)言、編碼風(fēng)格和健壯性方面存在巨大差異,同時(shí)這些腳本的版本管理也是一個(gè)挑戰(zhàn)。第二是腳本的傳承問(wèn)題,人員的離職和工作交接,都會(huì)導(dǎo)致腳本無(wú)法很好地在
服務(wù)器運(yùn)維人員之間傳承和再利用,因?yàn)橄乱粋€(gè)
服務(wù)器運(yùn)維人員可能無(wú)法理解和修改前一個(gè)
服務(wù)器運(yùn)維人員編寫的腳本功能。第三是批量管理工具的選擇。不同的管理人員選擇不同的批量管理工具必然會(huì)帶來(lái)管理混亂的問(wèn)題,也無(wú)法很好地實(shí)現(xiàn)在
服務(wù)器運(yùn)維人員之間互相備份工作的需求。因此,對(duì)構(gòu)建自動(dòng)化運(yùn)維體系的要求變得越來(lái)越迫切。
通過(guò)自動(dòng)化運(yùn)維體系來(lái)實(shí)現(xiàn)標(biāo)準(zhǔn)化和提高工程效率,是唯一正確的選擇。那么如何建設(shè)自動(dòng)化運(yùn)維體系呢?分為三個(gè)大的方面:
第一個(gè)是為什么要建設(shè)自動(dòng)化運(yùn)維體系,就是解決“3W”中的Why和What的問(wèn)題,即為什么和是什么。
第二個(gè)是介紹我司各個(gè)運(yùn)維子系統(tǒng)是怎樣設(shè)計(jì)、運(yùn)行和處理問(wèn)題的,解決“3W”中的How的問(wèn)題,也就是怎樣去做的。
第三個(gè)是對(duì)我司在自動(dòng)化運(yùn)維過(guò)程中遇到的一些問(wèn)題的思考,做一個(gè)總結(jié)。
一、建設(shè)自動(dòng)化運(yùn)維體系的原因先來(lái)看一下我們?yōu)槭裁匆ㄔO(shè)一個(gè)自動(dòng)化運(yùn)維體系。首先來(lái)看運(yùn)維遇到的一些挑戰(zhàn),如下圖所示。
運(yùn)維面對(duì)的挑戰(zhàn)第一個(gè)是游戲的需求。它表現(xiàn)為三個(gè)方面:一是游戲數(shù)量多,我司現(xiàn)在運(yùn)營(yíng)的游戲多達(dá)近百款。二是游戲架構(gòu)復(fù)雜。游戲公司和一般的互聯(lián)網(wǎng)公司有一個(gè)很大的區(qū)別,就是游戲的來(lái)源可能有很多,比如有國(guó)外的、國(guó)內(nèi)的,有大廠商的、小廠商的;每個(gè)游戲的架構(gòu)可能不一樣,有的是分區(qū)制的,有的是集中制的,各種各樣的需求。三是操作系統(tǒng)種類多,這與剛才的情況類似,游戲開(kāi)發(fā)者的背景與編程喜好不一樣,會(huì)有Windows、Linux等。第二個(gè)是在硬件環(huán)境方面,主要表現(xiàn)為服務(wù)器數(shù)量多、服務(wù)器型號(hào)多。因?yàn)楣緩慕⒌浆F(xiàn)在有十幾年的時(shí)間了,在這個(gè)過(guò)程中分批、分期采購(gòu)的服務(wù)器幾乎橫跨各大OEM廠商的各大產(chǎn)品線,型號(hào)多而雜。最后是人的因素。我們?cè)诮ㄔO(shè)自動(dòng)化運(yùn)維體系過(guò)程中,有一個(gè)比較重要的考慮點(diǎn)是人的因素。如果大家的技術(shù)能力都很強(qiáng),很多時(shí)候一個(gè)人可以完成所有工作,可能也就不需要自動(dòng)化運(yùn)維體系了。正是因?yàn)槊總€(gè)
服務(wù)器運(yùn)維人員的能力不一樣,技術(shù)水平參差不齊,甚至是運(yùn)維習(xí)慣和工具也不一樣,導(dǎo)致我們必須要?jiǎng)?chuàng)建一套規(guī)范的自動(dòng)化運(yùn)維體系,來(lái)提升工作效率。
二、建設(shè)自動(dòng)化運(yùn)維體系的目標(biāo)再看一下建設(shè)這套自動(dòng)化運(yùn)維體系的目標(biāo),也就是說(shuō)我們的原則是什么?自動(dòng)化運(yùn)維體系的建設(shè)目標(biāo)總結(jié)為四個(gè)詞。
第一個(gè)是“完備”,這個(gè)系統(tǒng)要能涵蓋所有的運(yùn)維需求。
第二個(gè)是“簡(jiǎn)潔”,簡(jiǎn)單好用。如果系統(tǒng)的操作流程、操作界面、設(shè)計(jì)思想都比較復(fù)雜,運(yùn)維人員的學(xué)習(xí)成本就會(huì)很高,使用的效果是會(huì)打折扣的,系統(tǒng)的能力、發(fā)揮的效率也會(huì)因此打折扣。
第三個(gè)是“高效”,特別是在批量處理或者執(zhí)行特定任務(wù)時(shí),我們希望系統(tǒng)能夠及時(shí)給用戶反饋。
第四個(gè)是“安全”,如果一個(gè)系統(tǒng)不安全,可能導(dǎo)致很快就被黑客接管了。所以安全也是重要的因素。
三、自動(dòng)化運(yùn)維體系的結(jié)構(gòu)和運(yùn)作方式下圖所示是我們當(dāng)前自動(dòng)化運(yùn)維體系的幾個(gè)子系統(tǒng),我們來(lái)看一看它們是怎樣聯(lián)合起來(lái)工作的。首先服務(wù)器會(huì)經(jīng)由自動(dòng)化安裝系統(tǒng)完成安裝,然后會(huì)被自動(dòng)化運(yùn)維平臺(tái)接管。自動(dòng)化運(yùn)維平臺(tái)會(huì)對(duì)自動(dòng)化安檢系統(tǒng)、自動(dòng)化客戶端更新系統(tǒng)和服務(wù)器端更新系統(tǒng)提供底層支撐。自動(dòng)化數(shù)據(jù)分析系統(tǒng)和自動(dòng)化客戶端更新系統(tǒng)會(huì)有關(guān)聯(lián)關(guān)系。自動(dòng)化數(shù)據(jù)分析系統(tǒng)會(huì)對(duì)自動(dòng)化客戶端更新系統(tǒng)的結(jié)果給予反饋。
以上內(nèi)容由北京艾銻無(wú)限科技發(fā)展有限公司整理