中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

智能運維大數(shù)據(jù)的終極寶典(附圖表解析)

2019-04-16    來源:raincent

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

一、何為智能運維 ?

生產(chǎn)設(shè)備/裝備是工業(yè)的重要生產(chǎn)工具,其可靠性、性能對工業(yè)生產(chǎn)有重大影響。隨著工業(yè)大數(shù)據(jù)推進,設(shè)備的智能運維被定義為一個重要的應(yīng)用領(lǐng)域。但何為智能運維?目前還沒有一個明確的定義,但有不少提法,我們將其初略歸納為4種模式:

♦ 智能決策,如預(yù)測性維修、故障診斷等PHM、運維運作優(yōu)化;

♦ 智能裝備,將云端分析結(jié)果直接作用到端(如傳感器偏差矯正);

♦ 新業(yè)務(wù)模式,如共享備件庫存等;

♦ 結(jié)合其他新興技術(shù)的新能力(如基于無人機的自動巡檢、基于AR的協(xié)同運維)。

智能運維運維只所以很難給出一個明確定義,是因為運維業(yè)務(wù)涉及的維度復雜性。下圖我們從業(yè)務(wù)用戶、過程環(huán)節(jié)和業(yè)務(wù)目標3個維度去描述,不同維度組合決定了智能運維的內(nèi)涵的不同。我們可以廣義認為只要能夠提高運維業(yè)務(wù)目標的措施都可以稱為智能運維。

 

 

以用戶角色為例,設(shè)備制造商與業(yè)主的動機不同。設(shè)備制造商主要從降低事故損失(包括直接損失、生產(chǎn)影響/產(chǎn)品形象等間接性損失)角度去看,落在預(yù)測性維修、提高維修效率(或降低MTTR)等方面。業(yè)主(生產(chǎn)企業(yè))主要從保證生產(chǎn)連續(xù)性(或提高設(shè)備OEE)的角度去看。即使在同一個生產(chǎn)企業(yè)內(nèi)部,生產(chǎn)運行部的關(guān)注和設(shè)備部也有微妙差別,生產(chǎn)運行部更加關(guān)心生產(chǎn)的穩(wěn)定性和連續(xù)性,而設(shè)備部則關(guān)注設(shè)備延壽、設(shè)備狀態(tài)維修和維修效率。

二、大數(shù)據(jù)平臺能提供什么?

智能運維通常涉及到大量裝備的高頻傳感數(shù)據(jù)(機器狀態(tài)、工況等)以及豐富的上下文信息(環(huán)境、運維等),屬于典型的工業(yè)大數(shù)據(jù)應(yīng)用。除了大數(shù)據(jù)平臺的共性需求之外(提供動態(tài)接入、質(zhì)量在線處理、時序數(shù)據(jù)壓縮與索引等數(shù)據(jù)存儲,以及并行化計算功能),智能運維還有不少工業(yè)設(shè)備的特有需求。下面從行業(yè)數(shù)據(jù)模型、行業(yè)算法、行業(yè)知識庫三個角度進行闡述。

行業(yè)數(shù)據(jù)模型:設(shè)備全生命周期檔案

設(shè)備智能運維的一個前提就是設(shè)備的全生命周期檔案,記錄設(shè)備的過往今生以及不同維度的信息。這是大數(shù)據(jù)應(yīng)該解決的基礎(chǔ)問題。包括設(shè)備結(jié)構(gòu)(BOM)、維修履歷、故障記錄、異常預(yù)警記錄、工況、檔案、基本信息等維度。

 

 

設(shè)備全生命周期檔案,不僅僅是多個數(shù)據(jù)源Data Schema層面的關(guān)聯(lián),還包括業(yè)務(wù)語義層面的處理,包括編碼間的映射關(guān)系(例如,設(shè)備編碼規(guī)則改變前后的對映)、同義詞(例如,風速在不同時期數(shù)據(jù)標準中的字段名可能不同)、字段名稱相同但業(yè)務(wù)語義不同(以油氣生產(chǎn)中的“產(chǎn)量”為例,井下產(chǎn)量、井口產(chǎn)量、集輸產(chǎn)量等不同口徑的“產(chǎn)量”,因為測量方式、測量環(huán)境、測量標準不同存在很大差別)。大數(shù)據(jù)平臺在提供行業(yè)建模工具時候一定要注意業(yè)務(wù)語義層面的需求。

以設(shè)備檔案數(shù)據(jù)模型為基礎(chǔ),大數(shù)據(jù)平臺提供基于圖搜索技術(shù)的語義查詢模型,以友好的方式支撐設(shè)備管理分析。以風機為例,當葉片斷裂事故發(fā)生后,整機制造商運維主管想查看確認是否為葉片批次問題(即和當前風機使用同一葉片廠商的風機最近機艙加速度是否正常?),有了圖語義模型的支持,后臺可以自動跨越多個表格進行查詢(而不需要用戶/應(yīng)用開發(fā)者寫復雜的表間關(guān)聯(lián)語句),這樣將大大降低應(yīng)用開發(fā)的工作量。

 

 

行業(yè)數(shù)據(jù)模型:工業(yè)知識圖譜

在設(shè)備運維中,除了設(shè)備檔案數(shù)據(jù),通常還存在大量的故障案例、設(shè)備維修過程記錄等非結(jié)構(gòu)數(shù)據(jù)。這些記錄中蘊含著大量的故障征兆、排查方法等實操經(jīng)驗,對后續(xù)的運維有很大指導和借鑒作用。通用的文本分析,由于缺乏行業(yè)專有名詞(專業(yè)術(shù)語、廠商、產(chǎn)品型號、量綱等)、語境上下文(包括典型工況描述、故障現(xiàn)象等),分析效果欠佳。這就需要構(gòu)建特定領(lǐng)域的行業(yè)知識圖譜(即工業(yè)知識圖譜),并將工業(yè)知識圖譜與結(jié)構(gòu)化數(shù)據(jù)圖語義模型融合,實現(xiàn)更加靈活的查詢。

行業(yè)分析算法:已有分析資產(chǎn)(Matlab/Python/R)的并行化

大數(shù)據(jù)平臺也需要支持已有分析模型的快速成熟。在大數(shù)據(jù)興起之前,企業(yè)就開發(fā)了不少基于Matlab/Python/R語言的單機分析模型,只不過缺乏大量數(shù)據(jù)驗證。經(jīng)典的大數(shù)據(jù)并行化系統(tǒng)(Map-reduce)要求重新編寫分析程序,但通用平臺算法庫(如MLib/Mahout)對工業(yè)分析的分析函數(shù)(比如,信號處理、系統(tǒng)辨識)支持有限。而在很多工業(yè)分析場景中,記錄間存在著時序關(guān)系,并行化分組通常是有明確業(yè)務(wù)語義的字段(比如,風功率曲線計算是按照風機、月份進行并行化),而不是記錄條數(shù)。因此,工業(yè)大數(shù)據(jù)平臺應(yīng)該支持非侵入式的Matlab/Python/R并行化,用戶只需指定可并行化的數(shù)據(jù)字段,對單機分析程序做簡單適配之后,就可以直接甩到大數(shù)據(jù)平臺上做全量并行化,通過大數(shù)據(jù)的迭代,去偽存真,探究海量數(shù)據(jù)后面的一般性規(guī)律,實現(xiàn)企業(yè)已有分析資產(chǎn)和實踐經(jīng)驗的快速變現(xiàn)。

行業(yè)分析算法:工況特征庫與時序分析算法庫

在經(jīng)典分析算法庫(包括深度學習)和非結(jié)構(gòu)化數(shù)據(jù)(文本、音頻、圖像/視頻等)算法的基礎(chǔ)上,提供設(shè)備故障和運行狀態(tài)分析所需的特征庫或算法庫。

針對工況時序數(shù)據(jù),提供時序切割、時序分解、時序聚類、時序聚類、典型模式挖掘等共性分析算法。

動力學系統(tǒng)分析所需的算法(系統(tǒng)辨識、ODE仿真等)。

針對典型工業(yè)單元(如電機、齒輪箱、反應(yīng)釜等)的FTA(Fault Tree Analysis),包括典型故障類型、特征變量,以及故障的研判方法。例如,對高速旋轉(zhuǎn)部件的振動分析算法庫(時域、頻域和時頻分析)。

 

 

行業(yè)知識庫:故障診斷/運維案例庫

針對典型設(shè)備的故障診斷和運維,企業(yè)和社區(qū)通常存在著大量運維工單、經(jīng)驗總結(jié)報告、社區(qū)討論等;诠I(yè)知識圖譜分析和行業(yè)專家的梳理,形成針對特定領(lǐng)域的案例庫,并形成半結(jié)構(gòu)化的維度標簽,方便檢索和語義推理。

 

 

行業(yè)知識庫:診斷模版庫

針對典型設(shè)備的故障診斷,形成診斷模板,并與設(shè)備資產(chǎn)檔案字段關(guān)聯(lián)。在應(yīng)用開發(fā)時,只需要數(shù)據(jù)實例化,就有了60~70%的成熟度,后面只需要根據(jù)實際數(shù)據(jù)和特定控制邏輯做一定定制化。

 

 

三、智能運維大數(shù)據(jù)分析的CRAB規(guī)劃方法

正如第一節(jié)討論,不同行業(yè)、不同設(shè)備、不同角色企業(yè)的智能運維差異很大,在智能運維的實踐中,我們初步歸納出CRAB四部法。在規(guī)劃上,運維大數(shù)據(jù)相對質(zhì)量大數(shù)據(jù)要輕松一些,因為設(shè)備運維與生產(chǎn)工藝的耦合度沒有質(zhì)量分析那么大,且設(shè)備通常有很多共性基礎(chǔ)單元構(gòu)成。

 

 

業(yè)務(wù)上下文(Context)理解

業(yè)務(wù)上下文包括如下四個方面。缺乏這些基本面的把控,智能運維大數(shù)據(jù)分析很容易與業(yè)務(wù)脫節(jié)。

 

主導企業(yè)的資源能力(Resource)分析

主要從如下三個方面進行分析:

(1)主導企業(yè)在產(chǎn)業(yè)鏈中的獨到能力:決定了智能運維的側(cè)重點在什么地方。

不同設(shè)備特征(機理/結(jié)構(gòu)復雜度、失效模式、數(shù)字化程度)、不同角色的知識/信息資源程度也會決定智能運維的著力點。對于比如風力發(fā)電機、航空發(fā)動機等主力生產(chǎn)設(shè)備,并且生產(chǎn)過程也是透明的,則設(shè)備制造商可以掌握大量類似設(shè)備的數(shù)據(jù),從而在數(shù)據(jù)技術(shù)和知識基礎(chǔ)較業(yè)主有很大優(yōu)勢。但對鼓風機、機床等裝備,只是生產(chǎn)制造設(shè)備中的一環(huán),設(shè)備制造商即使可以掌握設(shè)備自身的狀態(tài)信息,但對整個生產(chǎn)的工況、生產(chǎn)控制、工藝以及其他相關(guān)設(shè)備狀態(tài)缺乏了解,設(shè)備故障預(yù)警對設(shè)備制造商來說有一定的限制。因此,在進行設(shè)備運維業(yè)務(wù)規(guī)劃時候,要充分了解業(yè)務(wù)上下文(Context),決定了智能運維的側(cè)重點在什么地方。

(2)數(shù)據(jù)資產(chǎn)

在了解相關(guān)IT系統(tǒng)(SCADA、MRO等)基礎(chǔ)上,還應(yīng)該從CPS(Cyber-Physical System)思維的角度,去審思Cyber在多大程度上反映了Physical?在哪些地方有較大差距?這就需要

♦ 邏輯層面的融合:在了解設(shè)備的數(shù)字化程度之上,將IT系統(tǒng)中的數(shù)據(jù)與設(shè)備動力學機理、控制邏輯、環(huán)境、工況、生產(chǎn)控制等信息融合起來,去看現(xiàn)實世界中的例外情形。比如,MRO訂單中寫的保養(yǎng)項在大多數(shù)情形下是否忠實執(zhí)行(用明確的數(shù)據(jù)記錄,但不一定真實);備件需求是否存在囤貨行為(永遠不會有明確的數(shù)據(jù)記錄,但切實影響到了備件銷售量的這個數(shù)字)。

♦ 數(shù)據(jù)的場景化:在數(shù)據(jù)中重現(xiàn)所有業(yè)務(wù)場景,更直觀地了解這些場景下數(shù)據(jù)的分布和走勢。如下圖所示,當風機重啟或個別變槳PLC重啟時,可以在數(shù)據(jù)中清楚地看出槳距角的初始化過程。

 

 

同時,也盡力去發(fā)現(xiàn)業(yè)務(wù)訪談中沒有提到的“異常”場景。以下圖為例,在早期業(yè)務(wù)訪談中,大家一直認為低風速下風機應(yīng)該處于停機狀態(tài)(槳距角在90度左右),但實際數(shù)據(jù)表明,低風速下風機也可能處于待機狀態(tài)。這對于業(yè)務(wù)人員來說是默認的常識(但發(fā)生頻度低),故而早期業(yè)務(wù)訪談中客戶沒有提及,若數(shù)據(jù)探索不夠細致,這樣的風險將傳遞給后續(xù)的建模環(huán)節(jié)。

 

 

♦ 技術(shù)領(lǐng)域常識對數(shù)據(jù)能力的基本指導:在如下所示的P-F圖,給出了在不同失效階段,哪些表征量(紅外、振動、油質(zhì)、聲波、溫度等)是顯著的?梢越o大家一個基本面的判斷,消除很多不必要的“幻想”。

 

 

source:https://production-technology.org/tag/probability-of-an-injury/

(3)行業(yè)經(jīng)驗與知識

對于不少問題,一線業(yè)務(wù)人員或行業(yè)專家已經(jīng)有了相對清晰的認識,這時候沒有必要走純粹數(shù)據(jù)挖掘的思路。但大數(shù)據(jù)仍有很多價值,因為很多專家經(jīng)驗通常不夠精確(模糊、歧義、不完備、多個邏輯間的沖突),大數(shù)據(jù)平臺通過支持“大-小數(shù)據(jù)”迭代,快速支持行業(yè)經(jīng)驗在全量數(shù)據(jù)上的驗證與精化。

針對典型的設(shè)備故障以及診斷的問題,大數(shù)據(jù)平臺或數(shù)據(jù)分析案例庫通常積累了很多故障模式、故障原因、故障因素/表征以及常用的診斷模版,但FMEA(Failure mode and effectsanalysis)、FTA(Failure Tree Analysis)經(jīng)典方法對于細化一個具體設(shè)備的故障模式很有幫助。

 

 

針對典型的設(shè)備故障以及診斷的問題,大數(shù)據(jù)平臺或數(shù)據(jù)分析案例庫通常積累了很多故障模式、故障原因、故障因素/表征以及常用的診斷模版,但FMEA(Failure mode and effectsanalysis)、FTA(Failure Tree Analysis)經(jīng)典方法對于細化一個具體設(shè)備的故障模式很有幫助。

業(yè)務(wù)模式與技術(shù)方案(Analysis)設(shè)計

主要包括如下3個方面。技術(shù)方案設(shè)計在前面質(zhì)量大數(shù)據(jù)分析的文章中討論過,這里不再贅述。

業(yè)務(wù)模式如何運作智能運維業(yè)務(wù)、如何度量成功

技術(shù)方案設(shè)計大數(shù)據(jù)平臺設(shè)計、數(shù)據(jù)分析技術(shù)路線、應(yīng)用設(shè)計

推進階段推進階段

在業(yè)務(wù)模式設(shè)計上,要從業(yè)務(wù)應(yīng)用場景的角度去思考智能運維的業(yè)務(wù)需求。例如,有很多設(shè)備運維過程,雖然實現(xiàn)了遠程“監(jiān)視“(而不是“監(jiān)控”),但異常/故障判斷仍然全部靠大量的人工,業(yè)務(wù)需求就是降低監(jiān)視的人力工作量。該業(yè)務(wù)需求的技術(shù)方案從表面看起來是一套故障/異常自動研判系統(tǒng)(構(gòu)建一個高精度的機器學習模型自動研判),但若深一點思考,就會發(fā)現(xiàn)很多關(guān)鍵生產(chǎn)中要求“零誤判、零漏判”。此時,“輔助決策”是唯一的現(xiàn)實方式。再深入一層,“輔助決策“又可分為2種方式:

♦ 機器學習模型研判供參考,人工終判;

♦ 構(gòu)建一個自動研判模型(機器學習+行業(yè)經(jīng)驗)實現(xiàn)對相當大比例樣本的100%精度的自動研判,其余的樣本留給人工去判斷。在很多實時性強或人力消耗大的業(yè)務(wù)場景,這種方式通常更受歡迎。

在技術(shù)方案設(shè)計上,同樣要考慮到應(yīng)用場景的需求與限制。例如,“云+端”是個很好的提法,但要考慮網(wǎng)絡(luò)延遲、數(shù)據(jù)安全、模型穩(wěn)定性等現(xiàn)實限制。

執(zhí)行路線圖(Blueprint)

根據(jù)課題定位,進行關(guān)鍵技術(shù)攻關(guān),從模型的精度、穩(wěn)定性等維度快速評價工藝落地的可行性。對于技術(shù)可行的課題,選擇合適的產(chǎn)品類型和地點,進行控制性實驗,最后進行大規(guī)模的應(yīng)用推廣工作(以及對應(yīng)的大數(shù)據(jù)應(yīng)用開發(fā))。在分析模型投入試點之前,最好能夠跳出技術(shù),回歸到業(yè)務(wù)角度進行再“再思考”,至少回答以下3個問題:

♦ 模型的應(yīng)用場景:給誰用?對于預(yù)警/預(yù)測,提前量是多少?是否足夠采取必要的干預(yù)動作?模型的漏報率、誤報率對生產(chǎn)意味著什么?用戶使用時傾向于的交互界面是什么(比如,在高空運維時,語音也許比觸摸屏好)?

♦ 模型所需輸入的可獲得性:在模型運行時,這些信息是否能夠全部獲得?

模型的適用范圍,以及例外情形處理策略:如果遇到未建模情形,如何處理?模型結(jié)果的Worst-case是什么?應(yīng)對措施是什么?

四、總結(jié)

本文簡要討論了我們在應(yīng)用KMX大數(shù)據(jù)平臺實施智能運維項目中的部分經(jīng)驗與感想。和很多其他大數(shù)據(jù)應(yīng)用一樣,智能運維應(yīng)從業(yè)務(wù)出發(fā),將大數(shù)據(jù)技術(shù)融入到企業(yè)的運營與技術(shù)體系,融入的具體業(yè)務(wù)流程與環(huán)節(jié)。

 

標簽: [db:TAGG]

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:數(shù)據(jù)中心巨頭宣布推出新的高速互連技術(shù)

下一篇:夏普的多事之秋,與即將迎來的行業(yè)新紅利