一提到智能運維,很多人都會首先聯(lián)想到這項技術在IT和互聯(lián)網(wǎng)領域的應用。經(jīng)過近年來的演變發(fā)展,智能運維已經(jīng)逐漸形成一套成熟和完善的AIOps理論和架構,并日益在實際應用中顯示出巨大的價值。從每年的雙十一血拼“蓋樓大賽”,春節(jié)“搶紅包”等海量用戶參與的網(wǎng)上活動,到今年新冠疫情推動了線上業(yè)務的大規(guī)模爆發(fā),人們已經(jīng)習慣并享受在線工作和娛樂模式。但是每一個線上業(yè)務的成功背后,都有著智能運維技術的功勞。它不僅能為有海量用戶參與的大型在線活動提供運行保障,也使得類似金融、電子商務、網(wǎng)約車、社交平臺等對于可靠性、連續(xù)性具有高要求的互聯(lián)網(wǎng)系統(tǒng)得以高效穩(wěn)定地運行。
智能運維技術在互聯(lián)網(wǎng)領域的成功應用,不僅印證了這種技術的可行性,也使得人們開始進一步思考它在更廣闊領域的發(fā)展?jié)摿?。例如,對國民?jīng)濟至關重要的制造業(yè),是否也可以利用智能運維的技術體系實現(xiàn)轉型和提升呢?答案是肯定的。
IT系統(tǒng)設備是互聯(lián)的數(shù)字化設備,對標準化、集中度和穩(wěn)定性要求普遍較高。盡管與此相比,多數(shù)制造業(yè)尤其是離散制造業(yè)對于維護及時間響應的要求沒有大型IT服務系統(tǒng)那么高,但不停機、免維護、少故障同樣是讓制造業(yè)夢寐以求的圖景。因此,制造業(yè)對智能運維的需求,便隨著競爭的加劇而愈發(fā)迫切。
傳統(tǒng)制造業(yè)系統(tǒng)由大量分散、孤立和多樣化非標的生產(chǎn)系統(tǒng)設備組成,要實現(xiàn)智能運維是非常困難和有挑戰(zhàn)的。但隨著近年來數(shù)字化及互聯(lián)企業(yè)技術的發(fā)展和賦能,制造業(yè)的智能運維已經(jīng)成為可能。尤其是2020年春天,隨著新冠疫情在中國乃至全世界的蔓延,大量人員被隔離的同時交通受限,這些突發(fā)的沖擊使得不少企業(yè)無法正常運行、供應鏈斷裂,造成巨大損失。這種痛定思痛的啟發(fā),使得人們再次把目光聚焦到制造業(yè)的智能運維及遠程維護上。
對于制造業(yè)來說,智能制造一直是過去幾年的熱門話題,而智能運維正是智能制造的一種表現(xiàn)形式,它把智能制造從一個概念變成了更加具象化的目標。當智能制造的方法論落地實施之時,企業(yè)實現(xiàn)智能運維應用的步伐即可闊步向前。
當然,我們也應認識到:智能運維并不是一個可以一蹴而就的目標。對公司架構、生產(chǎn)組織以及生產(chǎn)裝備進行數(shù)字化、網(wǎng)絡化和智能化的轉型升級,正是企業(yè)真正實現(xiàn)智能運維的先決條件和必要步驟。
智能運維之數(shù)字化
智能運維最重要的基礎是數(shù)字化,因為數(shù)字化使得人們能夠獲取實時、豐富的數(shù)據(jù)。對孤立的數(shù)據(jù)而言,其價值僅限于它所代表的數(shù)據(jù)源的物理含義,但數(shù)據(jù)經(jīng)過傳送、分享并且和其他數(shù)據(jù)整合起來加以利用的過程,則可能會產(chǎn)生指數(shù)級的價值提升;數(shù)據(jù)加上算法,更能夠產(chǎn)生智能化的應用。
對于制造業(yè)的智能運維來說,當務之急的第一步正是準確了解企業(yè)各個環(huán)節(jié)、各個位置在當前的實際狀態(tài),只有對機器、產(chǎn)線和車間運營情況一目了然,才能根據(jù)需要適時做出調(diào)整。在傳統(tǒng)生產(chǎn)模式下,即便工作人員在車間現(xiàn)場,由于數(shù)據(jù)不可見,很多時候即便人在現(xiàn)場,也無法了解機器的健康情況,有些非計劃的停機及其導致的生產(chǎn)中斷往往無法避免。
但一旦實現(xiàn)了智能運維,生產(chǎn)管理人員通過數(shù)字化手段,無論在現(xiàn)場還是在遠端,都能立刻獲知生產(chǎn)進度、材料損耗、機器的OEE指標及產(chǎn)品的質(zhì)量情況,甚至可以關聯(lián)到客戶訂單、材料供應、價格波動及交貨進度等信息。所有這一切都是從設備、工藝及生產(chǎn)管理系統(tǒng)、企業(yè)業(yè)務系統(tǒng)的數(shù)字化基礎建設中帶來的好處。而數(shù)字化之后的互聯(lián)互通,則進一步提升了人們對數(shù)據(jù)價值充分利用和挖掘的能力。
智能運維之網(wǎng)絡化
當企業(yè)從數(shù)字化進程中獲得了大量的數(shù)據(jù)后,這些數(shù)據(jù)要形成運維的價值,還必須在一個互聯(lián)企業(yè)的框架下才能實現(xiàn)。也就是說,智能運維除了要求有底層數(shù)據(jù)以外還要一直在線,使得數(shù)據(jù)經(jīng)過傳送、整理和清洗后,可以通過適當?shù)乃惴ㄌ幚碜兂蛇\維所需的信息,供本地或者遠程的運維人員使用,從而在獲得這些信息時可以做出運維方面的調(diào)整和應對策略。
而為了保證運維系統(tǒng)數(shù)據(jù)的實時暢通和人員的互聯(lián),互聯(lián)企業(yè)中所建立的橫向互聯(lián)、縱向互聯(lián)和端到端互聯(lián)起到了類似企業(yè)的血液輸送系統(tǒng)的作用。當然,僅僅依靠數(shù)字化和網(wǎng)絡化還不足以建立起智能運維的體系,還需要一個智能平臺,才能真正實現(xiàn)智能運維的功能。
智能運維之平臺
企業(yè)數(shù)字化轉型的最終目的,還是要實現(xiàn)例如智能運維這樣的智能化目標。在依托數(shù)字化、網(wǎng)絡化打好基礎之后,智能運維的核心還需要依靠企業(yè)的智能化平臺來進行。通常,這樣的平臺可以架設在企業(yè)的數(shù)據(jù)中心、私有云或者公有云之上,平臺的搭建可以利用羅克韋爾自動化提供的FactoryTalkInnovationSuite來完成。不同行業(yè)、不同企業(yè)在不同階段對于智能運維的要求可能不盡相同,但是其功能通常可以由以下的十個功能模塊進行覆蓋:
可以看到,這些模塊的功能很多,企業(yè)需要在不同的階段,利用不同的模塊,從不同的角度幫助管理者或者系統(tǒng)來解決運維中的問題。
例如,其中最重要的用來保證生產(chǎn)運營的功能就包含了以下事件,如果按其任務緊急程度和響應時間從快到慢進行排序,則有:報警監(jiān)控>可視界面>異常檢測>故障定位>根因分析>故障排除>升級管理>災難恢復>預測維護>生產(chǎn)管控>能源管理>物料管理>安全策略>資產(chǎn)管理>EHS合規(guī)。當然,這些事件在不同企業(yè)當中的優(yōu)先級也可能不盡相同。
而這些事件的處理,無論在本地還是遠程,都需要用一個平臺來處理收集上來的數(shù)據(jù),多個數(shù)據(jù)的關聯(lián)則可以還原事件場景。這一平臺提供了數(shù)據(jù)和數(shù)據(jù)分析處理的工具及算法,現(xiàn)在我們把對這些事件的處理程序及預案用算法代碼寫進APP,就可以利用這些APP來實現(xiàn)運維了。