近日,Gartner?發(fā)布了《中國AIOps市場指南》(Market Guide for AIOps, China, August 2023)。在該市場指南中,Gartner對中國的AIOps市場及代表廠商進(jìn)行了詳細(xì)分析,其中,深信服作為代表廠商入選該市場指南。
Gartner表示:
“中國對AIOps的興趣與日俱增。據(jù)Gartner研究《預(yù)測:2021-2027年全球IT運(yùn)營管理軟件》(Forecast: IT Operations Management Software, Worldwide, 2021-2027):中國AIOps市場預(yù)計(jì)在2023年至2025年間每年增長46.9%,從3020萬美元增至6490萬美元。”
對于AIOps,Gartner則描述道:
“AIOps平臺(tái)通過將AI集成到事件管理流程中來增強(qiáng)、加速和自動(dòng)化對來自監(jiān)控和可觀察工具的信號(hào)的響應(yīng),從而增強(qiáng)IT運(yùn)營管理。這涵蓋了異常檢測、事件關(guān)聯(lián)和減少、根本原因分析以及加速或自動(dòng)修復(fù)等領(lǐng)域?!?/p>
我們認(rèn)為,隨著中國經(jīng)濟(jì)的不斷發(fā)展、人工智能技術(shù)的日益普及,各行業(yè)用戶的數(shù)字化進(jìn)程都在加速,而網(wǎng)絡(luò)安全風(fēng)險(xiǎn)、IT基礎(chǔ)設(shè)施管理難度也日趨增大。AIOps的出現(xiàn),不僅幫助各行業(yè)用戶更快速準(zhǔn)確地處理龐大數(shù)據(jù),更可以幫助企業(yè)以更高的人效比完成復(fù)雜的運(yùn)維工作。
近年來,深信服在AI、大數(shù)據(jù)等前沿技術(shù)上加大投入,并將研發(fā)成果落地到全線產(chǎn)品中。在該份市場報(bào)告中,深信服憑借著AIOps天工引擎入選為國內(nèi)AIOps技術(shù)領(lǐng)域的代表廠商。
由深信服創(chuàng)新研究院與信服云聯(lián)合打造的AIOps天工引擎,串聯(lián)海量數(shù)據(jù),聯(lián)動(dòng)50+人工智能算法,為用戶的IT基礎(chǔ)設(shè)施及云平臺(tái)提供全生命周期精細(xì)化運(yùn)營和運(yùn)維能力,可覆蓋150+典型故障場景,7-30天提前預(yù)測、1分鐘發(fā)現(xiàn)、3分鐘快速定位,幫助用戶大幅提升運(yùn)維效率。
具體來說,深信服AIOps天工引擎構(gòu)筑了以下能力——
全棧資源監(jiān)控
向上覆蓋云主機(jī)、桌面應(yīng)用、數(shù)據(jù)庫、業(yè)務(wù)健康狀態(tài)、資源狀態(tài)等業(yè)務(wù)層監(jiān)控指標(biāo),向下覆蓋云平臺(tái)、底層服務(wù)器/存儲(chǔ)/CPU/內(nèi)存/RAID等硬件狀態(tài),形成全面監(jiān)控體系。同時(shí)建立統(tǒng)一數(shù)據(jù)采控體系,覆蓋800+監(jiān)控指標(biāo),可支撐上層監(jiān)控和告警場景,以便用戶快速對故障進(jìn)行感知、定位和修復(fù)。
硬件故障預(yù)測與檢測
提前預(yù)測磁盤/內(nèi)存的“亞健康”狀態(tài),主動(dòng)預(yù)測故障風(fēng)險(xiǎn),及時(shí)通知運(yùn)維人員對硬盤巡檢確認(rèn)并對業(yè)務(wù)進(jìn)行遷移,避免業(yè)務(wù)宕機(jī)、數(shù)據(jù)丟失等重大問題的發(fā)生。
對主機(jī)內(nèi)存故障進(jìn)行預(yù)測,及時(shí)提醒更換故障內(nèi)存條,減少內(nèi)存錯(cuò)誤引發(fā)的宕機(jī)對云主機(jī)造成的業(yè)務(wù)影響。
對主機(jī)硬盤故障進(jìn)行預(yù)測,基于日志數(shù)據(jù)或指標(biāo)數(shù)據(jù)進(jìn)行分析推理和判斷,天工引擎可提前7-30天精準(zhǔn)預(yù)測故障,預(yù)測準(zhǔn)確度在90%以上。
資源預(yù)測與畫像
可提前預(yù)測主機(jī)、虛擬機(jī)資源需求趨勢,預(yù)測準(zhǔn)確率達(dá)96.8%。運(yùn)維人員可以通過資源畫像了解資源的整體情況、細(xì)分情況。天工引擎可對過載資源容量進(jìn)行提前預(yù)警,根據(jù)歷史容量趨勢規(guī)律,指導(dǎo)當(dāng)前業(yè)務(wù)進(jìn)行合理擴(kuò)容,避免緊急擴(kuò)容導(dǎo)致的系統(tǒng)性風(fēng)險(xiǎn)。
告警收斂與根因分析
告警收斂可縮減90%以上重復(fù)告警規(guī)模,提高告警的精準(zhǔn)度和可讀性,在避免告警風(fēng)暴的同時(shí),助力運(yùn)維人員在海量信息與大量告警中快速定位并修復(fù)故障。
同時(shí),天工引擎基于AI算法+專家領(lǐng)域知識(shí),構(gòu)建全棧業(yè)務(wù)卡慢檢測與根因定位能力,實(shí)現(xiàn)自動(dòng)故障診斷,并提供閉環(huán)處置的建議。運(yùn)維效率提升30%,平均問題定位時(shí)間(Mean Time to Identify,MTTI)降低50%。
網(wǎng)絡(luò)全鏈路質(zhì)量感知分析
全鏈路網(wǎng)絡(luò)分析技術(shù)通過全面感知、分析和預(yù)測網(wǎng)絡(luò),將不同的網(wǎng)絡(luò)平面進(jìn)行關(guān)聯(lián)映射,可識(shí)別典型網(wǎng)絡(luò)故障,減少70%的故障隱患,分鐘級定位50+種典型故障場景,解決鏈路拓?fù)潢P(guān)系割裂、連通性、可見性低的問題,幫助用戶快速定位問題所在。
基于運(yùn)維知識(shí)圖譜、深度學(xué)習(xí)、遷移學(xué)習(xí)、小樣本等核心技術(shù),AIOps天工引擎已廣泛用于深信服超融合、桌面云、托管云等產(chǎn)品。