91精品人妻互换日韩精品久久影视|又粗又大的网站激情文学制服91|亚州A∨无码片中文字慕鲁丝片区|jizz中国无码91麻豆精品福利|午夜成人AA婷婷五月天精品|素人AV在线国产高清不卡片|尤物精品视频影院91日韩|亚洲精品18国产精品闷骚

您當(dāng)前位置:首頁(yè) > 新聞?lì)l道 > 技術(shù)動(dòng)態(tài) > 正文
關(guān)于機(jī)場(chǎng)運(yùn)維數(shù)據(jù)的大數(shù)據(jù)分析與開(kāi)發(fā)

作者:張毅

l  引言

    近些年來(lái),隨著民航運(yùn)輸?shù)目焖侔l(fā)展,我國(guó)已經(jīng)成為了全球最具發(fā)展?jié)摿Φ暮娇帐袌?chǎng)。由于機(jī)場(chǎng)建設(shè)、機(jī)場(chǎng)設(shè)施部署和機(jī)場(chǎng)運(yùn)營(yíng)受到資金、技術(shù)和人力等資源的制約,加之機(jī)場(chǎng)運(yùn)營(yíng)各環(huán)節(jié)日漸復(fù)雜,旅客服務(wù)需求更加個(gè)性化,對(duì)機(jī)場(chǎng)的運(yùn)營(yíng)管理提出了更高的要求。為了更科學(xué)地提升機(jī)場(chǎng)的管理效能,使旅客的出行體驗(yàn)更加便捷、高效和個(gè)性化,搭建統(tǒng)一的大數(shù)據(jù)平臺(tái),進(jìn)行航班、商業(yè)、運(yùn)維的大數(shù)據(jù)分析就成了首都機(jī)場(chǎng)最迫切的要求。

    作為大型國(guó)際樞紐機(jī)場(chǎng),首都機(jī)場(chǎng)在大數(shù)據(jù)的探索中也走在了行業(yè)的最前沿,很早首都機(jī)場(chǎng)就提出了“讓數(shù)據(jù)說(shuō)話”的研究課題,也組成了專門(mén)的數(shù)據(jù)專家組。首都機(jī)場(chǎng)從2005年開(kāi)始建設(shè)統(tǒng)一的數(shù)據(jù)中心系統(tǒng),作為首都機(jī)場(chǎng)各類元數(shù)據(jù)的管理型數(shù)據(jù)倉(cāng)庫(kù)。直到2014年我們開(kāi)始搭建民航業(yè)基于機(jī)場(chǎng)業(yè)務(wù)的大數(shù)據(jù)平臺(tái)智能運(yùn)營(yíng)管理平臺(tái),再到最近的“大數(shù)據(jù)在大型機(jī)場(chǎng)運(yùn)維管理中的應(yīng)用研究”科技項(xiàng)目探索。首都機(jī)場(chǎng)一直致力于從企業(yè)的整體角度而非單個(gè)部門(mén)對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一管理,從而共享、分發(fā)、同步所有信息,創(chuàng)建可靠一致的企業(yè)視圖,通過(guò)減輕對(duì)不一致、不完整或重復(fù)數(shù)據(jù)的依賴,促使整個(gè)企業(yè)的運(yùn)營(yíng)更加卓爾有效。本文提出的對(duì)于運(yùn)維數(shù)據(jù)的大數(shù)據(jù)分析是首都機(jī)場(chǎng)大數(shù)據(jù)分析的一個(gè)分支,我們致力于通過(guò)對(duì)于運(yùn)維數(shù)據(jù)的預(yù)測(cè)、搜索和優(yōu)化使機(jī)場(chǎng)的IT運(yùn)維管理更有效率,使機(jī)場(chǎng)的IT系統(tǒng)管理員從紛繁復(fù)雜并且重復(fù)性的運(yùn)維工作中解脫出來(lái),可以把更多的精力放在業(yè)務(wù)創(chuàng)新中去。

2  運(yùn)維大數(shù)據(jù)

    運(yùn)維大數(shù)據(jù)顧名思義即系統(tǒng)運(yùn)維產(chǎn)生的海量數(shù)據(jù),一般廣義上的運(yùn)維數(shù)據(jù)是指公司的業(yè)務(wù)運(yùn)營(yíng)和生產(chǎn)運(yùn)行中產(chǎn)生的所有數(shù)據(jù)的總和。而狹義上的運(yùn)維數(shù)據(jù)則專指信息系統(tǒng)運(yùn)行維護(hù)中產(chǎn)生的機(jī)器數(shù)據(jù),在這里我們重點(diǎn)分析的是狹義運(yùn)維數(shù)據(jù)。

    信息系統(tǒng)的運(yùn)維數(shù)據(jù)按照數(shù)據(jù)類型分類主要有以下分類:機(jī)器配置信息、告警信息、狀態(tài)信息、性能信息、資產(chǎn)數(shù)據(jù)、變更及事件記錄,機(jī)器日志數(shù)據(jù)。運(yùn)維數(shù)據(jù)按照產(chǎn)生的來(lái)源主要有以下分類。

    (1)硬件數(shù)據(jù):服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)設(shè)備、強(qiáng)弱電設(shè)備、機(jī)房相關(guān)設(shè)備產(chǎn)生的信息數(shù)據(jù)。

    (2)系統(tǒng)數(shù)據(jù):操作系統(tǒng)、數(shù)據(jù)庫(kù)、中間件的日志信息數(shù)據(jù)。

    (3)應(yīng)用數(shù)據(jù):各種應(yīng)用系統(tǒng)和業(yè)務(wù)系統(tǒng)產(chǎn)生的業(yè)務(wù)相關(guān)數(shù)據(jù)。

    (4)服務(wù)管理系統(tǒng)數(shù)據(jù):各種資產(chǎn)系統(tǒng)、變更管理系統(tǒng)、監(jiān)控系統(tǒng)、決策支持系統(tǒng)等產(chǎn)生的數(shù)據(jù)。

    運(yùn)維大數(shù)據(jù)的特點(diǎn)除了具有大數(shù)據(jù)4大特點(diǎn)數(shù)量大、種類多、快速化(處理速度要求高)、價(jià)值化(需要從海量的不相關(guān)的數(shù)據(jù)中找到高價(jià)值)之外還具有以下特點(diǎn):大量的非結(jié)構(gòu)化數(shù)據(jù)、大量來(lái)自異構(gòu)環(huán)境的數(shù)據(jù)以及流數(shù)據(jù)的特點(diǎn)(實(shí)時(shí)到達(dá);次序獨(dú)立,不受應(yīng)用系統(tǒng)所控制;數(shù)據(jù)規(guī)模宏大且不能預(yù)知其最大值;數(shù)據(jù)一經(jīng)處理,除非特意保存,否則不能被再次取出處理,或者再次提取數(shù)據(jù)代價(jià)昂貴)。

2.1首都機(jī)場(chǎng)的信息系統(tǒng)運(yùn)維管理

    首都機(jī)場(chǎng)的信息系統(tǒng)擔(dān)負(fù)著公司主要運(yùn)行業(yè)務(wù)譬如前端離港、安檢、航顯以及集成等機(jī)場(chǎng)業(yè)務(wù)應(yīng)用的后臺(tái)數(shù)據(jù)計(jì)算、交互、存儲(chǔ)的技術(shù)支持。首都機(jī)場(chǎng)信息技術(shù)部負(fù)責(zé)該信息系統(tǒng)的運(yùn)行維護(hù)工作。隨著,隨著機(jī)場(chǎng)業(yè)務(wù)量的與日俱增以及為旅客服務(wù)的不斷精細(xì)化的需求。截止到2015年,由首都機(jī)場(chǎng)信息部負(fù)責(zé)管理的信息系統(tǒng)共有將近200套運(yùn)行系統(tǒng),300余臺(tái)服務(wù)器,5000余臺(tái)終端。

    首都機(jī)場(chǎng)信息系統(tǒng)按照地域劃分主要分為兩個(gè)區(qū)域東區(qū)(T3航站樓)系統(tǒng),西區(qū)(Tl/T2航站樓)系統(tǒng)。信息部的系統(tǒng)運(yùn)行維護(hù)管理工作主要包括以下內(nèi)容:主機(jī)監(jiān)控、網(wǎng)絡(luò)監(jiān)控、運(yùn)行資產(chǎn)管理、應(yīng)用故障答疑及故障排除、運(yùn)行分析、問(wèn)題通報(bào)、運(yùn)行制度的建立、服務(wù)商管理、投產(chǎn)版本控制、運(yùn)行事務(wù)協(xié)調(diào)、機(jī)房、設(shè)備間管理、綜合布線管理等。

    基于對(duì)服務(wù)日益精細(xì)化的需求,首都機(jī)場(chǎng)的業(yè)務(wù)對(duì)于信息系統(tǒng)的業(yè)務(wù)連續(xù)性和高可用性的要求也越來(lái)越高,而首都機(jī)場(chǎng)現(xiàn)在的信息系統(tǒng)仍然面臨著眾多問(wèn)題。

    (1) IT系統(tǒng)架構(gòu)仍為豎井式架構(gòu),系統(tǒng)之間流通不暢,數(shù)據(jù)不兼容。系統(tǒng)與數(shù)據(jù)庫(kù)均具備雙機(jī)或集群環(huán)境但是仍然頻繁碰到單點(diǎn)假死,導(dǎo)致集群失效,業(yè)務(wù)中斷的故障。大部分關(guān)鍵系統(tǒng)配置了第三備機(jī),總體高可用性較好,但是在需要第三備機(jī)恢復(fù)業(yè)務(wù)的時(shí)候經(jīng)常會(huì)遇到業(yè)務(wù)數(shù)據(jù)未與主備機(jī)同步的問(wèn)題,該問(wèn)題會(huì)影響到業(yè)務(wù)恢復(fù)時(shí)間。

    (2)磁盤(pán)陣列基本均為單點(diǎn),部分磁盤(pán)陣列為單控制器,部分應(yīng)用服務(wù)器為單點(diǎn),難以抵御失效的主機(jī)風(fēng)險(xiǎn)。大部分系統(tǒng)的本地恢復(fù)手段為手工方式,缺乏統(tǒng)一的數(shù)據(jù)備份平臺(tái)及備份策略,部分備份數(shù)據(jù)保存在本地,缺乏恢復(fù)驗(yàn)證機(jī)制,將面臨備份數(shù)據(jù)不一致,甚至不可用的風(fēng)險(xiǎn)。缺少容災(zāi)中心。

    (3)東西區(qū)數(shù)據(jù)中心相對(duì)獨(dú)立,但是之間的互聯(lián)存在斷聯(lián)風(fēng)險(xiǎn),在數(shù)據(jù)集中的現(xiàn)今亟待解決東西區(qū)系統(tǒng)整合,建立統(tǒng)一數(shù)據(jù)平臺(tái)的問(wèn)題。

    (4)缺乏統(tǒng)一的基于信息系統(tǒng)全流程的監(jiān)控系統(tǒng),缺少詳細(xì)的易于管理的配置變更管理系統(tǒng)。以至信息管理部門(mén)很難制訂一套適合自身的資產(chǎn)管理系統(tǒng)和設(shè)備生命周期管理系統(tǒng)。

    (5)對(duì)現(xiàn)有的數(shù)據(jù)管理不夠精細(xì)化,甚至無(wú)法實(shí)現(xiàn)對(duì)所有信息系統(tǒng)歷史數(shù)據(jù)的保存。缺少一個(gè)集存儲(chǔ)、抽取、分析、統(tǒng)計(jì)、展現(xiàn)功能于一體的對(duì)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行統(tǒng)一管理的大數(shù)據(jù)平臺(tái)。缺乏一套將業(yè)務(wù)數(shù)據(jù)和機(jī)器日志數(shù)據(jù)進(jìn)行聯(lián)動(dòng)和可尋找關(guān)聯(lián)關(guān)系的模型和方法論。

2.2機(jī)場(chǎng)的信息系統(tǒng)的運(yùn)維數(shù)據(jù)

    信息系統(tǒng)數(shù)據(jù)主要包括日志文件、報(bào)錯(cuò)信息、IT應(yīng)用系統(tǒng)數(shù)據(jù)。其中日志文件主要包括各操作系統(tǒng)、數(shù)據(jù)庫(kù)、應(yīng)用軟件的系統(tǒng)日志、事件日志。IT應(yīng)用系統(tǒng)數(shù)據(jù)主要包括ITSM(IT系統(tǒng)管理系統(tǒng))的變更管理、配置管理數(shù)據(jù)以及監(jiān)控系統(tǒng)的服務(wù)器、存儲(chǔ)、交換機(jī)的監(jiān)控?cái)?shù)據(jù)。

2.3  為什么要對(duì)機(jī)場(chǎng)IT運(yùn)維數(shù)據(jù)進(jìn)行分析

    我們回顧一下機(jī)場(chǎng)信息系統(tǒng)運(yùn)維管理的歷史,早期的信息系統(tǒng)運(yùn)維管理相當(dāng)簡(jiǎn)單,運(yùn)維基本都進(jìn)行集中管理,即使部門(mén)也是按照業(yè)務(wù)系統(tǒng)來(lái)進(jìn)行分界,譬如離港模塊、航顯模塊,地面信息模塊。每套信息系統(tǒng)從始至終作為功能完整的簡(jiǎn)單作業(yè)運(yùn)行,很少與其他系統(tǒng)或者部門(mén)進(jìn)行聯(lián)動(dòng)和交互。而現(xiàn)在的運(yùn)維和業(yè)務(wù)則發(fā)生了很大變化,需求明顯向著更復(fù)雜的業(yè)務(wù)關(guān)鍵型應(yīng)用、復(fù)合式應(yīng)用以及實(shí)時(shí)應(yīng)用快速轉(zhuǎn)變。同時(shí)系統(tǒng)之間的關(guān)聯(lián)性也日益復(fù)雜,數(shù)據(jù)流紛繁復(fù)雜,譬如外網(wǎng)網(wǎng)站的航班信息數(shù)據(jù)需要從旅客自助平臺(tái)傳輸過(guò)來(lái),而旅客自助平臺(tái)數(shù)據(jù)和航站樓廣播系統(tǒng)的數(shù)據(jù)又是從航顯系統(tǒng)得到。以上這種轉(zhuǎn)變對(duì)業(yè)務(wù)各個(gè)方面都產(chǎn)生了影響,甚至用于訪問(wèn)這種新基礎(chǔ)架構(gòu)的技術(shù)也發(fā)生了根本性變化。這種現(xiàn)代化的運(yùn)維環(huán)境有時(shí)更趨向“物聯(lián)網(wǎng)”,包括各種移動(dòng)設(shè)備以及先前并非互聯(lián)互通的設(shè)備,而現(xiàn)在這些設(shè)備共同構(gòu)成了機(jī)場(chǎng)運(yùn)維的基礎(chǔ)架構(gòu)。所有這些要素都和物理基礎(chǔ)架構(gòu)有關(guān),因此帶來(lái)了額外的復(fù)雜性。另外在當(dāng)今的市場(chǎng)條件下,業(yè)務(wù)系統(tǒng)是不允許宕機(jī)的,即使一個(gè)小的系統(tǒng)出現(xiàn)故障也可能導(dǎo)致其他一些關(guān)鍵生產(chǎn)業(yè)務(wù)發(fā)生意想不到的問(wèn)題,同時(shí)系統(tǒng)運(yùn)行緩慢或者崩潰對(duì)營(yíng)業(yè)收入,公司業(yè)績(jī),客戶滿意度以及品牌信譽(yù)都有著直接的影響,具體到機(jī)場(chǎng)的業(yè)務(wù),一套安檢系統(tǒng)的應(yīng)用服務(wù)器發(fā)生宕機(jī),將直接導(dǎo)致機(jī)場(chǎng)的安檢排隊(duì)等候的旅客大量聚集,很容易造成群體性事件。同時(shí)還會(huì)導(dǎo)致大面積航班延誤,造成機(jī)場(chǎng)的不安全事件。

    為了對(duì)當(dāng)今的設(shè)備及其復(fù)雜性有一個(gè)感性的認(rèn)識(shí),我們以首都機(jī)場(chǎng)數(shù)據(jù)中心為例,每天大概有10000個(gè)以上的機(jī)器事件被觸發(fā),產(chǎn)生大約200兆字節(jié)的相關(guān)運(yùn)維數(shù)據(jù),而如果包括業(yè)務(wù)數(shù)據(jù),每天首都機(jī)場(chǎng)數(shù)據(jù)中心則會(huì)產(chǎn)生2G以上的數(shù)據(jù)。在這么大量的信息和事件中,隱藏著不少需要評(píng)估并解決的故障單。

    另外目前機(jī)場(chǎng)的運(yùn)維數(shù)據(jù)中超過(guò)50%的數(shù)據(jù)都是非結(jié)構(gòu)化的。這些非結(jié)構(gòu)化數(shù)據(jù)包含各種各樣的數(shù)據(jù)類型,如航班信息、系統(tǒng)行為、應(yīng)用性能、用戶操作和視頻音頻等。大多數(shù)使用關(guān)系數(shù)據(jù)庫(kù)或多維數(shù)據(jù)庫(kù)的傳統(tǒng)工具都沒(méi)有能力應(yīng)對(duì)目前的海量運(yùn)維數(shù)據(jù)的復(fù)雜性和規(guī)模。這些工具也無(wú)法靈活地執(zhí)行查詢或獲取答案。

2.4管理信息系統(tǒng)的日志

    我們希望對(duì)于運(yùn)維的實(shí)時(shí)和歷史數(shù)據(jù)分析方面實(shí)現(xiàn)重大創(chuàng)新。采集大量結(jié)構(gòu)化與半結(jié)構(gòu)化的數(shù)據(jù),通過(guò)分析機(jī)制將其改造成為可操作的數(shù)據(jù),這首先要做到的就是日志的集中管理,包括系統(tǒng)中間件日志和應(yīng)用日志,然后實(shí)現(xiàn)日志搜索和基于日志信息的統(tǒng)計(jì)分析以及日志數(shù)據(jù)歸檔和歷史分析。接下來(lái)我們需要對(duì)運(yùn)維日志進(jìn)行數(shù)據(jù)分析即將客戶應(yīng)用系統(tǒng)中的交易流水、日志通過(guò)規(guī)則解析并完成索引,并通過(guò)設(shè)置查詢規(guī)則來(lái)發(fā)現(xiàn)應(yīng)用系統(tǒng)的問(wèn)題,進(jìn)行提前預(yù)警。

2.5如何對(duì)機(jī)場(chǎng)的運(yùn)維數(shù)據(jù)進(jìn)行分析

2.5.1  問(wèn)題發(fā)展趨勢(shì)分析

    通過(guò)全維度的數(shù)據(jù)采集構(gòu)建全樣本數(shù)據(jù)倉(cāng)庫(kù):以應(yīng)用系統(tǒng)為主線,跨層面及維度的各類日志采集、歸檔、查詢、分析、報(bào)警;7*24小時(shí)監(jiān)控應(yīng)用系統(tǒng)、中間件、Oracle數(shù)據(jù)庫(kù),及硬件產(chǎn)品的運(yùn)行狀態(tài),同時(shí)可以生成完整的監(jiān)控報(bào)告。通過(guò)統(tǒng)一的多維度報(bào)表展示故障時(shí)間、故障頻次的全流程故障統(tǒng)計(jì)管理。通過(guò)模型構(gòu)建分析并預(yù)測(cè)系統(tǒng)狀態(tài)為管理提供決策依據(jù):構(gòu)建預(yù)測(cè)模型,提供預(yù)測(cè)分析并輔助運(yùn)維管理者制定決策。

2.5.2  問(wèn)題診斷分析

    通過(guò)時(shí)間窗口和模式挖掘來(lái)檢測(cè)潛在故障影響因子,挖掘歷史相似問(wèn)題加速問(wèn)題解決。通過(guò)動(dòng)態(tài)數(shù)據(jù)分析IT運(yùn)維與業(yè)務(wù)數(shù)據(jù)規(guī)律與關(guān)聯(lián):采集網(wǎng)絡(luò)報(bào)文、性能數(shù)據(jù)、報(bào)警消息、交易數(shù)據(jù)等動(dòng)態(tài)數(shù)據(jù)采集,分析系統(tǒng)運(yùn)維安全隱患、潛在故障、容量情況等,并對(duì)新上線的系統(tǒng)進(jìn)行輔助測(cè)試。

    性能問(wèn)題快速精確定位。在應(yīng)用系統(tǒng)碰到性能問(wèn)題的時(shí)候,我們可以通過(guò)對(duì)代碼級(jí)層面的深度鉆取,并比照相應(yīng)的知識(shí)庫(kù)系統(tǒng)分辨性能問(wèn)題由那條代碼導(dǎo)致,從而快速精確定位系統(tǒng)性能問(wèn)題與瓶頸。

    性能趨勢(shì)分析與潛在隱患排查。在我們的日常運(yùn)維中,通過(guò)一定時(shí)間數(shù)據(jù)采集和積累,可以分析系統(tǒng)性能趨勢(shì),結(jié)合業(yè)務(wù)規(guī)劃為升級(jí)或優(yōu)化決策提供數(shù)據(jù)參考;同時(shí)根據(jù)業(yè)務(wù)發(fā)展,也能夠獲得整體應(yīng)用系統(tǒng)在哪些層面可能成為瓶頸及是否存在系統(tǒng)隱患。

    新應(yīng)用上線前的性能輔助測(cè)試。我們首都機(jī)場(chǎng)新開(kāi)發(fā)的應(yīng)用系統(tǒng)上線前一般都會(huì)經(jīng)歷功能測(cè)試和性能測(cè)試以及壓力測(cè)試,測(cè)試通過(guò)后才能正式上線。我們可以在性能測(cè)試過(guò)程中,將對(duì)新業(yè)務(wù)系統(tǒng)的測(cè)試結(jié)果以多維度抓取并展示,從另一個(gè)角度輔助測(cè)試系統(tǒng)性能。

2.5.3  實(shí)時(shí)預(yù)測(cè)分析

    挖掘潛在導(dǎo)致重復(fù)問(wèn)題出現(xiàn)的關(guān)聯(lián)影響規(guī)則(比如相同類型的變更導(dǎo)致重復(fù)發(fā)生問(wèn)題),提供預(yù)防性建議.用可視化的方法來(lái)展示過(guò)去曾發(fā)生的問(wèn)題,并發(fā)現(xiàn)它們的共性:?jiǎn)栴}的癥狀,相關(guān)的服務(wù)器,中間件等,以及解決此類問(wèn)題的專家信息。

2.5.4  系統(tǒng)生命周期規(guī)劃預(yù)測(cè)分析

    針對(duì)歷史軟硬件問(wèn)題,提供優(yōu)選升級(jí)策略及生命周期管理。利用時(shí)間序列分析方法來(lái)識(shí)別服務(wù)器負(fù)載的異常以及負(fù)載異常與應(yīng)用故障的關(guān)聯(lián)關(guān)系。通過(guò)對(duì)機(jī)場(chǎng)的ITSM系統(tǒng)的同類設(shè)備的事件管理日志歷史數(shù)據(jù)進(jìn)行不同時(shí)間段內(nèi)的統(tǒng)計(jì)分析判斷重要生產(chǎn)系統(tǒng)的硬件、系統(tǒng)是否達(dá)到了需要進(jìn)行更換的地步?梢詤f(xié)助運(yùn)維人員了解各應(yīng)用系統(tǒng)的運(yùn)維趨勢(shì),結(jié)合機(jī)場(chǎng)的業(yè)務(wù)發(fā)展和規(guī)劃,將因系統(tǒng)即將到達(dá)生命周期而導(dǎo)致的宕機(jī)故障發(fā)生率減到最低。

2.5.5實(shí)現(xiàn)系統(tǒng)自主分析

隨著全新自動(dòng)化”基于分析”運(yùn)維管理方案的發(fā)展,信息系統(tǒng)管理平臺(tái)已經(jīng)發(fā)生了巨大的變化。程序能夠查看信息系統(tǒng)活動(dòng);學(xué)習(xí)信息系統(tǒng)行為模式;找到所采集的系統(tǒng)數(shù)據(jù)中的異常并基于分析運(yùn)維數(shù)據(jù)時(shí)確定的模式和問(wèn)題預(yù)測(cè)未來(lái)系統(tǒng)行為。其數(shù)據(jù)分析的速度比人為手工方式要快得多,從而加快了問(wèn)題的解決,提高了準(zhǔn)確性并且避免了更多的問(wèn)題。通過(guò)運(yùn)維大數(shù)據(jù)進(jìn)行分析的運(yùn)維管理方案見(jiàn)圖1所示。

    前幾年運(yùn)維管理者更專注于簡(jiǎn)化用戶界面和集成管理組合,這提高了信息技術(shù)的管理效能,并且可以幫助降低數(shù)據(jù)中心的管理成本。但是現(xiàn)今的管理者更將注意力轉(zhuǎn)向?qū)\(yùn)維分析數(shù)據(jù)進(jìn)行自動(dòng)分析上,以進(jìn)一步減輕他們的工作量和人為失誤,并且在運(yùn)維問(wèn)題發(fā)生之前進(jìn)行預(yù)測(cè)。在此自動(dòng)化分析工具產(chǎn)生之前,故障排除系統(tǒng)、存儲(chǔ)、網(wǎng)絡(luò)問(wèn)題的負(fù)擔(dān)一直落在以超負(fù)荷工作的信息系統(tǒng)管理員身上,這些專業(yè)人員必須制定系統(tǒng)性能指標(biāo)和閥值,并且不得不使用時(shí)間監(jiān)控工具并分析日志文件,才能解決問(wèn)題。我們希望新的自動(dòng)運(yùn)維分析工具能夠比人為操作更快的識(shí)別問(wèn)題——從大型非結(jié)構(gòu)化存儲(chǔ)庫(kù)中獲得新的見(jiàn)解,通過(guò)對(duì)準(zhǔn)相關(guān)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),更快速地開(kāi)始進(jìn)行問(wèn)題根源分析,從而幫助隔離問(wèn)題;還能通過(guò)為管理員提供他們所需的信息使他們無(wú)需手動(dòng)篩選大量日志文件和其他運(yùn)維數(shù)據(jù),從而有助于更快速地修復(fù)問(wèn)題。信息系統(tǒng)管理員也可以從中騰出更多時(shí)間來(lái)關(guān)注價(jià)值更高的管理和調(diào)優(yōu)工作。

3  對(duì)于運(yùn)維大數(shù)據(jù)的分析使機(jī)場(chǎng)運(yùn)維效能得到提升

3.1  日常故障管理分析和優(yōu)化

我們從機(jī)場(chǎng)運(yùn)維系統(tǒng)的故障發(fā)現(xiàn)和解決內(nèi)容上看,對(duì)于故障的管理其實(shí)就是一次或者多次活動(dòng),因此我們對(duì)于單次的故障全流程繪制了活動(dòng)圖。

    由圖2可以看到我們運(yùn)維部門(mén)在發(fā)現(xiàn)故障的時(shí)候

是極其被動(dòng)的,在故障發(fā)生之后我們才能通過(guò)監(jiān)控到的一些故障現(xiàn)象去發(fā)現(xiàn)問(wèn)題,此時(shí)我們的應(yīng)用系統(tǒng)很有可能已經(jīng)受到了影響并導(dǎo)致業(yè)務(wù)中斷。其次問(wèn)題的處理過(guò)程較為復(fù)雜,具有明顯的環(huán)節(jié)多、時(shí)間長(zhǎng)、人力消耗大的特點(diǎn)。另外我們可以看到對(duì)于應(yīng)用、數(shù)據(jù)庫(kù)、操作系統(tǒng)、硬件和網(wǎng)絡(luò)的故障定位是串行的,在實(shí)現(xiàn)故障定位之后,再進(jìn)行日志收集和檢查,并根據(jù)報(bào)錯(cuò)信息搜索廠商的知識(shí)庫(kù)以及自己的經(jīng)驗(yàn)進(jìn)行故障處理。同時(shí)由于網(wǎng)絡(luò)管理員、系統(tǒng)管理員、數(shù)據(jù)庫(kù)管理員以及業(yè)務(wù)管理員各自負(fù)責(zé)不同的維護(hù)內(nèi)容。各管理員職能相對(duì)孤立,只是將運(yùn)維狀態(tài)單向匯報(bào)給值班經(jīng)理。也沒(méi)有有效的途徑使管理員之間進(jìn)行問(wèn)題修復(fù)的溝通。每個(gè)管理員只能掌握自己負(fù)責(zé)范圍的運(yùn)維狀態(tài),無(wú)法洞察到整體事件的運(yùn)行狀態(tài),這對(duì)應(yīng)急故障處理極其不利。同時(shí)隨著機(jī)場(chǎng)業(yè)務(wù)體系的擴(kuò)大,信息系統(tǒng)的規(guī)模呈幾何級(jí)增長(zhǎng)。在有限的時(shí)間里每個(gè)運(yùn)維人員的工作量也隨之增大。尤其是在一個(gè)系統(tǒng)管理員負(fù)責(zé)多個(gè)業(yè)務(wù)系統(tǒng)的時(shí)候,每天要負(fù)責(zé)的巡檢、變更等運(yùn)維工作紛繁復(fù)雜且重復(fù)性工作很多。

    在對(duì)運(yùn)維系統(tǒng)的大數(shù)據(jù)進(jìn)行分析之后,故障的管理過(guò)程也得到了相應(yīng)的優(yōu)化,我們可以看到優(yōu)化之后的故障管理活動(dòng)圖如圖3。我們通過(guò)圖3可以看到問(wèn)題管理的整體過(guò)程在以下三個(gè)方面得到了提升。

3.1.1  故障發(fā)生前——預(yù)測(cè)

    通過(guò)開(kāi)放接口,我們利用運(yùn)維大數(shù)據(jù)分析工具實(shí)時(shí)對(duì)所有機(jī)場(chǎng)負(fù)責(zé)的生產(chǎn)系統(tǒng)進(jìn)行運(yùn)維日志收集,將數(shù)據(jù)傳送到應(yīng)用程序,從而實(shí)現(xiàn)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的實(shí)時(shí)讀取。使用業(yè)界流行的流數(shù)據(jù)處理技術(shù),無(wú)需對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)。經(jīng)過(guò)系統(tǒng)僅捕獲和分析異常的相關(guān)信息,(這意味著只會(huì)捕獲相關(guān)數(shù)據(jù)并根據(jù)這些數(shù)據(jù)執(zhí)行操作,因此在尋找異常時(shí),寶貴的系統(tǒng)循環(huán)不瀏覽日志和其他數(shù)據(jù)源,這樣還可以節(jié)省出存儲(chǔ)空間)。通過(guò)比較一段時(shí)間的系統(tǒng)行為(分析時(shí)間序列數(shù)據(jù))“學(xué)習(xí)”系統(tǒng)/應(yīng)用程序行為模式。通過(guò)對(duì)比“好的”系統(tǒng)行為和“壞的”系統(tǒng)行為,在問(wèn)題發(fā)生之前找出問(wèn)題,為用戶提供一個(gè)識(shí)別潛在問(wèn)題并且在它們惡化之前修復(fù)這些問(wèn)題的方法。

3.1.2  故障處理中——搜索

    “搜索”可以被描述為采集大量模糊的非結(jié)構(gòu)化數(shù)據(jù)并通過(guò)分析工具將其轉(zhuǎn)化為洞察力,它具有以下5個(gè)作用。

    (1)使用簡(jiǎn)單的查詢語(yǔ)言在運(yùn)維全日志數(shù)據(jù)中搜索,通過(guò)關(guān)聯(lián)日志搜索結(jié)果與指標(biāo)進(jìn)行監(jiān)控。

    (2)基于從日志數(shù)據(jù)中發(fā)現(xiàn)到的趨勢(shì)進(jìn)行異常問(wèn)題的檢測(cè)和提醒。

    (3)通過(guò)分析將性能問(wèn)題進(jìn)行隔離,通過(guò)搜索功能可搜索隔離問(wèn)題的特定使用案例。

    (4)使用拓?fù)浣Y(jié)構(gòu)和配置內(nèi)容優(yōu)化要搜索的知識(shí)庫(kù)和已經(jīng)發(fā)生的事件記錄范圍,從而找出問(wèn)題的可能原因和問(wèn)題關(guān)聯(lián)和解決方案。

    (5)搜索和分析ITSM(IT服務(wù)管理系統(tǒng))中的服務(wù)工單或者對(duì)于工單內(nèi)容的關(guān)鍵項(xiàng)進(jìn)行統(tǒng)計(jì)、展示

3.1.3  故障解決后——優(yōu)化

    在問(wèn)題解決之后,做事后諸葛亮,對(duì)問(wèn)題進(jìn)行總結(jié)、記錄。自動(dòng)對(duì)系統(tǒng)進(jìn)行調(diào)優(yōu),調(diào)整系統(tǒng)資源分配和存儲(chǔ)資源分配,并進(jìn)行容量評(píng)估和工作負(fù)載和基礎(chǔ)架構(gòu)的最優(yōu)化,從而大幅提高工作效率并降低人力成本。

4  結(jié)論

之前系統(tǒng)管理員確定系統(tǒng)故障和解決問(wèn)題的時(shí)候,需要檢查監(jiān)控系統(tǒng)的報(bào)警日志和翻閱大量之前的故障案例和知識(shí)庫(kù)中的相關(guān)文檔才能確定異常,然后圍繞可用性、響應(yīng)時(shí)間等元素來(lái)分析系統(tǒng)性能,同時(shí)使用監(jiān)控工具追蹤問(wèn)題,使用日志文件檢查系統(tǒng)活動(dòng),并通過(guò)歷史經(jīng)驗(yàn)解決問(wèn)題。而通過(guò)本文,我們希望借助對(duì)信息系統(tǒng)的運(yùn)維大數(shù)據(jù)分析幫助用戶預(yù)測(cè)可能的中斷,并更快地搜索運(yùn)維數(shù)據(jù)以便找到并解決問(wèn)題,通過(guò)分析獲得的洞察優(yōu)化企業(yè)的IT和應(yīng)用基礎(chǔ)架構(gòu)。我們的目標(biāo)是從系統(tǒng)應(yīng)用日志的監(jiān)控方式對(duì)應(yīng)用交易進(jìn)行監(jiān)控,實(shí)現(xiàn)更加符合系統(tǒng)管理者的用戶習(xí)慣和更便捷有效的監(jiān)控能力;提供實(shí)時(shí)的應(yīng)用故障診斷輔助手段,快速解決問(wèn)題;通過(guò)關(guān)鍵績(jī)效指標(biāo)的設(shè)計(jì)來(lái)反映應(yīng)用及節(jié)點(diǎn)可用性和性能;并在問(wèn)題產(chǎn)生之前提示應(yīng)用維護(hù)人員采用措施阻止問(wèn)題產(chǎn)生。這樣首都機(jī)場(chǎng)的系統(tǒng)運(yùn)維人員就能從重復(fù)性的運(yùn)維工作中解脫出來(lái),為機(jī)場(chǎng)減少不必要的人力和資源的浪費(fèi)。

5【摘要】

本文介紹了運(yùn)維大數(shù)據(jù)的概念、運(yùn)維數(shù)據(jù)的特點(diǎn)以及運(yùn)維數(shù)據(jù)的分析方法和機(jī)場(chǎng)業(yè)對(duì)運(yùn)維大數(shù)據(jù)的需求。以首都機(jī)場(chǎng)信息系統(tǒng)運(yùn)維現(xiàn)狀為背景分析了如何通過(guò)對(duì)于運(yùn)維大數(shù)據(jù)的預(yù)測(cè)、搜索、優(yōu)化,為機(jī)場(chǎng)的信息系統(tǒng)運(yùn)行維護(hù)管理提供更優(yōu)化的方法、更便捷的流程、獲得更多的洞察力,從而使機(jī)場(chǎng)信息系統(tǒng)的運(yùn)行維護(hù)效率得到最大限度的提升。本文的目的是使IT運(yùn)維人員認(rèn)識(shí)到各種產(chǎn)生于我們?nèi)粘P畔⑾到y(tǒng)的機(jī)器數(shù)據(jù)的重要性,并理解如何借助統(tǒng)一的大數(shù)據(jù)平臺(tái)把不同類別、不同系統(tǒng)的運(yùn)維數(shù)據(jù)收集、整合起來(lái),通過(guò)統(tǒng)計(jì)和分析的方法,從雜亂無(wú)章的海量歷史數(shù)據(jù)中精煉出對(duì)于運(yùn)維人員更有價(jià)值的運(yùn)維最佳實(shí)踐。

關(guān)鍵字:

招商信息月點(diǎn)擊排行

About Us - 關(guān)于我們 - 服務(wù)列表 - 付費(fèi)指導(dǎo) - 媒體合作 - 廣告服務(wù) - 版權(quán)聲明 - 聯(lián)系我們 - 網(wǎng)站地圖 - 常見(jiàn)問(wèn)題 - 友情鏈接
Copyright©2014安裝信息網(wǎng) www.78375555.com. All rights reserved.
服務(wù)熱線:0371-61311617 郵箱:zgazxxw@126.com 豫ICP備18030500號(hào)-4
未經(jīng)過(guò)本站允許,請(qǐng)勿將本站內(nèi)容傳播或復(fù)制
安全聯(lián)盟認(rèn)證