企業(yè)運(yùn)維系統(tǒng)建設(shè)經(jīng)過多年演變,從以商業(yè)軟件為主,到開源軟件的百花齊放,極大的降低了成本,但是在建設(shè)過程中,卻非常容易落入到煙囪式建設(shè)的陷阱,因此如何跨越它,成為了眾多企業(yè)面臨的難題。
今天,我將從嘉為科技WeOps產(chǎn)品研發(fā)部負(fù)責(zé)人的角度,和大家共同探討如何重塑運(yùn)維系統(tǒng),跨越煙囪式建設(shè)的陷阱。接下來我將分為“開源的崛起”、“沒有銀彈”、“百花齊放”以及“融合聯(lián)動(dòng),重塑運(yùn)維工具”四部分來逐一詳細(xì)介紹,希望能給大家?guī)硪恍┧悸放c啟發(fā)。
*注:以下內(nèi)容整理自:嘉為科技WeOps產(chǎn)品研發(fā)部負(fù)責(zé)人 吳文豪 于嘉為藍(lán)鯨2022研運(yùn)一體創(chuàng)新峰會(huì)的精彩分享——《重塑運(yùn)維系統(tǒng):跨越煙囪式建設(shè)的陷阱》。
01. 開源的崛起
在我剛進(jìn)入運(yùn)維軟件開發(fā)領(lǐng)域的時(shí)候,開源軟件并不像現(xiàn)在這么火熱,絕大多數(shù)的企業(yè)使用的都是像Tivoli、微軟的System Center這類商業(yè)級(jí)閉源產(chǎn)品,在當(dāng)時(shí),我們沒法想象,一個(gè)非商業(yè)級(jí)的,沒有經(jīng)過大教堂式洗禮的軟件能夠像今天一樣,給我們的整個(gè)行業(yè)帶來如此大的沖擊。
之后在開源運(yùn)動(dòng)崛起的大背景下,各領(lǐng)域的運(yùn)維工具,都出現(xiàn)了優(yōu)秀的挑戰(zhàn)者,他們憑借著社區(qū)的力量大量吸收用戶,飛速的迭代,對(duì)老牌的閉源商業(yè)軟件發(fā)起了挑戰(zhàn)。例如基礎(chǔ)監(jiān)控領(lǐng)域的Zabbix、自動(dòng)化運(yùn)維領(lǐng)域的Ansible、APM領(lǐng)域的SkyWalking。
開源運(yùn)維軟件的興起為企業(yè)帶來了諸多紅利,使得建設(shè)成本高、技術(shù)黑盒、廠商捆綁等長(zhǎng)期困擾我們的問題得到了很好的解決:
1)建設(shè)成本變低
曾經(jīng)的閉源商業(yè)級(jí)產(chǎn)品大多都價(jià)格不菲,而開源軟件免費(fèi)使用的模式,使得運(yùn)維系統(tǒng)首次建設(shè)成本得到了數(shù)十倍的下降。
2)技術(shù)變得透明
開源軟件不僅免費(fèi),同時(shí)還開放源碼,將技術(shù)完全透明化,我們可以看到開源軟件的實(shí)現(xiàn)原理,并自行修改源碼的邏輯,滿足個(gè)性化業(yè)務(wù)需求。
3)避免廠商綁定
在源碼完全開放的背景下,我們不再被廠商捆綁,并擁有了工具軟件完全的掌控權(quán)。
02. 沒有銀彈
神話中,銀彈就是可以讓強(qiáng)大的狼人被一擊斃命的武器。而這里的銀彈,指的是一招制敵,提高數(shù)量級(jí)的效能水平,而不只是效能有明顯改觀。
我們期望的運(yùn)維系統(tǒng),是能夠通過開源運(yùn)維軟件的諸多優(yōu)勢(shì),快速,低成本的建設(shè)一個(gè)個(gè)幫助我們更好保障業(yè)務(wù)連續(xù)性的工廠,工廠之間通過數(shù)據(jù)網(wǎng)關(guān)、業(yè)務(wù)總線、數(shù)據(jù)湖等方式進(jìn)行聯(lián)動(dòng),幫助我們更好的為業(yè)務(wù)提供服務(wù)。
例如:
可惜的是,沒有銀彈。而在實(shí)際實(shí)踐過程中,我們也很容易就建設(shè)起一套一套的煙囪,這些運(yùn)維系統(tǒng)之間并沒有什么聯(lián)系。例如:我們想讓Zabbix的監(jiān)控?cái)?shù)據(jù)、ELK的日志數(shù)據(jù)、Data Gerry的CMDB數(shù)據(jù)組合在一起使用,我們將不得不在他們之上,重新搭建一套新的系統(tǒng)。
除了上述問題外,開源技術(shù)還給我們帶來了許多新的考驗(yàn):
1)逐漸黑盒化
由于大量開源項(xiàng)目缺少體系化的培訓(xùn)與規(guī)范的約束,隨著一些關(guān)鍵人員的變動(dòng),整個(gè)運(yùn)維體系的某些元素會(huì)出現(xiàn)黑盒化。
2)維護(hù)成本提升
由于開發(fā)框架多種多樣,以及Golang、Ruby、PHP、Java等各種技術(shù)棧,開源漏洞,系統(tǒng)Bug等問題,雖然開源軟件讓企業(yè)的建設(shè)成本降低,但維護(hù)成本卻急速提升。
3)數(shù)據(jù)聯(lián)動(dòng)困難
開源軟件解決了單一領(lǐng)域的問題,但是沒法很好的讓數(shù)據(jù)進(jìn)行聯(lián)動(dòng),面向業(yè)務(wù)解決問題,需要獨(dú)立開發(fā)一套軟件來進(jìn)行對(duì)接,過程中會(huì)出現(xiàn)非常多的API、表結(jié)構(gòu)兼容性問題。
除此之外,隨著新技術(shù)棧的出現(xiàn),企業(yè)運(yùn)維變得更加困難。我們不僅需要面對(duì)混合云、Serveless、AI、邊緣計(jì)算等等新的技術(shù),還要面對(duì)DevOps文化帶來的研發(fā)運(yùn)維體系變革。
企業(yè)的運(yùn)維團(tuán)隊(duì)不僅需要思考對(duì)內(nèi)保障穩(wěn)定運(yùn)行,為業(yè)務(wù)提供快速問題定位的能力、資產(chǎn)梳理的能力、標(biāo)準(zhǔn)化運(yùn)維的能力等。對(duì)外要為組織提供IT價(jià)值幫助組織業(yè)務(wù)的發(fā)展,將IT能力自助化,提升組織的運(yùn)轉(zhuǎn)效率,將運(yùn)維數(shù)據(jù)轉(zhuǎn)變成能夠幫助組織業(yè)務(wù)發(fā)展的運(yùn)營(yíng)數(shù)據(jù)等。
03. 百花齊放
隨著算力的突破,Deep Learning迎來了新的春天,大家的想法逐漸變得一致,我們都在思考,能不能在幾乎不做改動(dòng)的情況下,使用AIOps的方法,盡可能多的解決問題,例如把告警根因分析解決掉。
但是真正落地過AIOPS的企業(yè),都會(huì)在開始的時(shí)候就碰到了困難,算法工程師會(huì)告訴我們,他們需要完整的數(shù)據(jù)(Log、Metric、Event、資產(chǎn)關(guān)聯(lián)信息......)、規(guī)整的數(shù)據(jù)(清洗好的運(yùn)維數(shù)據(jù))以及先驗(yàn)知識(shí)(具體業(yè)務(wù)領(lǐng)域的知識(shí)),我們甚至沒法用合適的成本解決告警根因分析這個(gè)場(chǎng)景。
于是我們開始思考,這可能并不是AIOPS這項(xiàng)技術(shù)的問題,而是煙囪式運(yùn)維系統(tǒng)的設(shè)計(jì)與不斷涌現(xiàn)的業(yè)務(wù)訴求之間的矛盾。
與此同時(shí),在大洋的彼岸,有一批新興的閉源軟件企業(yè)開始用全新的架構(gòu),來重新塑造運(yùn)維系統(tǒng),例如我們耳熟能詳?shù)腟plunk、Datadog、MoogSoft。
以Splunk為例,Splunk設(shè)計(jì)了一個(gè)強(qiáng)大的非結(jié)構(gòu)化數(shù)據(jù)分析引擎,將所有的運(yùn)維數(shù)據(jù)都存放在了一起,讓上層的各個(gè)SaaS在一個(gè)統(tǒng)一的數(shù)據(jù)源上進(jìn)行演進(jìn),出現(xiàn)了如UEBA、ITSI、SOAR、MLToolkit等等的SaaS,運(yùn)維系統(tǒng)的建設(shè)逐漸迎來了百花齊放的時(shí)代。
04. 融合聯(lián)動(dòng),重塑運(yùn)維工具
在商業(yè)級(jí)閉源軟件再次崛起的過程中,開源社區(qū)也沒有停下自己的腳步,藍(lán)鯨平臺(tái)通過構(gòu)建PaaS底座,在設(shè)計(jì)之初就拒絕煙囪建設(shè)的思路,為我們提供了重塑運(yùn)維系統(tǒng)的一種選擇。
同時(shí)藍(lán)鯨配套的社區(qū)、認(rèn)證體系,讓大家在同一套規(guī)則下進(jìn)行SaaS的演進(jìn),使得我們可以避免運(yùn)維系統(tǒng)的逐漸黑箱化。
而嘉為科技WeOps團(tuán)隊(duì)在社區(qū)版藍(lán)鯨平臺(tái)的基礎(chǔ)上,進(jìn)行了整合封裝、提供了企業(yè)級(jí)的必備功能,并且提供了培訓(xùn)賦能、系統(tǒng)維保等服務(wù)。目標(biāo)是幫助中型企業(yè)用最合適的成本,獲得企業(yè)級(jí)的能力以及支撐,更好的應(yīng)對(duì)新的IT環(huán)境與文化。
05. 應(yīng)對(duì)變化,伴隨成長(zhǎng)
WeOps規(guī)劃了三個(gè)大的版本:
1)3.0(融合聯(lián)動(dòng))
3.0 系列我們以融合聯(lián)動(dòng)為主題,主要提供:基礎(chǔ)監(jiān)控、資產(chǎn)管理、自動(dòng)化運(yùn)維以及運(yùn)營(yíng)服務(wù)等能力。
2)4.0(可觀測(cè))
4.0 系列將提供日志分析、APM、Log、RUM等板塊。
3)5.0(智能化)
5.0 系列將通過Al技術(shù),使整個(gè)運(yùn)維效能得到更大幅度地提升。
WeOps采用訂閱模式,幫助企業(yè)漸進(jìn)使用,用更低的成本去獲得一套一體化運(yùn)維平臺(tái),漸進(jìn)式模式可以使得企業(yè)根據(jù)自身需求,使用部分模塊,提供更好的現(xiàn)金流保障。企業(yè)不再需要一次性投入大量成本進(jìn)行運(yùn)維系統(tǒng)的建設(shè),使用較低成本與產(chǎn)品共同成長(zhǎng)。而企業(yè)也可快速通過低成本去檢驗(yàn)產(chǎn)品與自身的適配性,避免試錯(cuò)高風(fēng)險(xiǎn)。
WeOps產(chǎn)品始終堅(jiān)持開源共建的思路,我們會(huì)不斷對(duì)WeOps板塊進(jìn)行持續(xù)性開源,與藍(lán)鯨社區(qū)進(jìn)行生態(tài)共建,更好地回饋社區(qū)。
ITSM運(yùn)營(yíng):服務(wù)請(qǐng)求管理持續(xù)改進(jìn)
查看詳細(xì)
AI驅(qū)動(dòng)IT運(yùn)維轉(zhuǎn)型:從審批流到AI工作流
查看詳細(xì)
國(guó)產(chǎn)化替代實(shí)踐:嘉為藍(lán)鯨全棧智能觀測(cè)中心對(duì)比IBM Tivoli
查看詳細(xì)
嘉為藍(lán)鯨平臺(tái):三位一體,打造云原生數(shù)字化基座
查看詳細(xì)
嘉為藍(lán)鯨DevOps研發(fā)效能管理平臺(tái):AI賦能研運(yùn),效能再進(jìn)化
查看詳細(xì)
ITSM運(yùn)營(yíng):事件管理持續(xù)改進(jìn)
查看詳細(xì)
申請(qǐng)演示